این فرآیند کلی تبدیل آنالوگ به دیجیتال نامیده می شود. خرید اکانت ایپی تی وی هنگامی که به یک CD یا MP3 گوش می دهید، آن اعداد با تبدیل دیجیتال به آنالوگ به صداهایی تبدیل می شوند که گوش شما می تواند بشنود .) تکه ای ازنرم افزار مسئول این فرآیند – تبدیل صدای صوتی به داده های دیجیتال و بازگشت دوباره در انتهای دیگر – به عنوان CODEC (Coder-Decoder) شناخته می شود. کدک های مورد استفاده برای VoIP به گونه ای طراحی شده اند که با صداهای فرکانس های چند صد هرتز (هرتز) تا شاید 5000 هرتز یا بیشتر (محدوده فرکانس صدای انسان) به طور بهینه کار کنند، اگرچه از قرن بیست و یکم تماس های تلفنی به همان اندازه ممکن است شامل داده های ویدیویی (چت) به عنوان صداهای صوتی است، سیستم های VoIP اغلب حاوی کدک های ویدیویی و همچنین صوتی هستند.
VoIP، همه چیز متفاوت است. تلفن اینترنتی بسیار شبیه تلفن همراه است Ip tv ، با افرادی که شماره تلفن های منحصر به فردی دارند که به طور دائم به یک مکان فیزیکی مرتبط نیستند: شخصی که با آن تماس می گیرید می تواند در هر نقطه ای از کره زمین باشد (و ممکن است دو روز متوالی در همان مکان نباشد. ). بنابراین اولین بخش از برقراری تماس VoIP شامل یافتن مکان گیرنده در اینترنت توسط رایانه شما، سیگنال دادن به رایانه آنها برای دریافت تماس است، و پس از انجام این کار، دو رایانه در مورد نحوه مبادله واقعی داده ها توافق می کنند. (همانطور که دستگاههای فکس و مودمها در شروع تماس «دست میدهند»). برای اینکه VoIP به طور موثر کار کند، هر رایانه ای که از آن استفاده می کند باید این کارها را دقیقاً به همان روش انجام دهد – و به همین دلیل است خرید ای پی تی وی که سیستم های VoIP از استانداردهای بین المللی مورد توافق استفاده می کنند (معروف به عنوانپروتکل ها ). دو پروتکلی که سیگنالدهی را پوشش میدهند، از نظر فنی با نامهای H.323 و SIP شناخته میشوند ( پروتکل شروع جلسه ، که گاهی با نام RFC 4168 نیز شناخته میشود). به زبان ساده، این پروتکل ها یک مسیر ارتباطی بین دو آدرس IP (آدرس فرستنده و گیرنده) ایجاد می کنند ای پی تی وی که از طریق آن می توان داده های تماس تلفنی واقعی را ارسال و دریافت کرد