اگر دقت کرده باشید تاکنون در زندگی روزمره برای بیان و فهم پدیدههای یکسانی، زبانها و بیانهای مختلفی وجود داشته است. زبان، خود مثال بارزی برای این موضوع است. مثلاً کلمات ”پنج ”، “5”، “Five”و ”بش” همه بیانگر یک واقعیت هستند. اگر دقت کنیم آنچه که روی لامپ تصویر یک مونیتور می بینیم هم بیان دیگر از همان سیگنالی است که روی Waveform میبینیم
یا آنچه که از یک باند میشنویم بیان دیگری ازهمان سیگنال صدایی است که میتوانیم روی اسکوپ یا VU meter ببینیم یا عددی که روی صفحه نمایش یک ولت متر می بینیم بیان دیگری از اختلاف ولتاژ دو نقطه است. یا دمایی که یک دماسنج نمایش میدهد بیان دیگری از حرارت یک نقطه است که میتوانیم با انگشت خود نیز آنرا احساس کنیم. شاید باور نکنید اگر ادعا کنیم ممکن است دو شکلموج زیر نیز دو بیان متفاوت از یک چیز یکسان باشند.
هدف از ذکر مثالهای فوق این بود که ادعا کنیم سیگنال
دیجیتال هم بیان دیگری از چیزی است که با سیگنال آنالوگ آنرا بیان کرده
بودیم. مثلاً خروجی آنالوگ و دیجیتال تصویر یک دوربین، دو بیان مختلف از یک
چیز واحد هستند. در اینجا مهم این است که بیانهای متفاوت از یک چیز یکسان
میتوانند نسبت به همدیگر مزایا و یا معایبی داشته باشند.
مثلاً
یادگیری زبان چینی و زبان انگلیسی را برای بیان یک چیز واحد تصور نمائید!
آیا با همان راحتی که میتوانیم عدد 17 را بفهمیم معادل لاتین آنرا یعنی “
XVII” را نیز می فهمیم یا معادل عربی آن را.
در سیستمهای اعداد نیز
مبناهای مختلفی برای شمارش و اعمال ریاضی وجود دارد که در بین آنها
سیستمهای مبنای ده (اعشاری، دسیمال )، مبنای 8 ( اکتال )،مبنای 16
(هگزادسیمال) و مبنای 2(باینری) مشهورترند.
از آنجاکه اعداد در مبنای 2،
فقط از دو رقم 0 و 1 ( یا دو حالت صفر و یک یا دو سطح ولتاژ ) تشکیل
شدهاند، این مبنا برای سیستم دیجیتال انتخاب شده است. حال به بیان اعداد
یکسان در دستگاههای مختلف شمارش میپردازیم:
کوچکترین واحد در اعداد باینری که میتواند صفر یا یک
باشد را “بیت” (bit) مینامند. مجموعهای از بیتها در کنار هم را یک کلمه
(Word) مینامند. بطور خاص، یک کلمه که دارای 8 بیت باشد را یک بایت(Byte)
مینامند.
معادل اعداد در مبنای 2، سیگنال الکتریکی وجود دارد که دارای
دو سطح بالا بعنوان “1” و سطح پایین بعنوان “0” است. شکل زیر بیانگر رابطه
بین شکلموج و کلمه باینری معادل آن است.
میتوان اعداد در مبناهای مختلف را بهم تبدیل کرد. برای تبدیل اعداد در مبنای دهدهی به مبنای 2 به مثال زیر توجه فرمائید. فرض کنید میخواهیم عدد 18 در مبنای ده را به مبنای 2 تبدیل کنیم.
بر این مبنا روابط منطقی زیر تعریف شده است:
در مورد این گیت هر چیزی که با صفر OR شود خودش و هر چیزی که با یک OR شود یک میشود:
در مورد این گیت هر چیزی که با صفر AND شود صفر و هر چیزی که با یک AND شود خودش میشود:
متمم صفر، یک و متمم یک، صفر میشود:
در مورد این گیت هر چیزی که با صفر XOR شود خودش و هر چیزی که با یک XOR شود، متممش میشود:
متمم گیتهای فوق نیز به نامهای NOR، NAND و XNOR وجود دارد. گیت NOT خود متمم گیت بافر است:
گیتهای فوق، عناصر پایهای ساخت تمام قطعات و مدارات دیجیتال هستند.
با حرکت به سمت و ورود به عرصه دیجیتال در صدا و تصویر، تنوع دستگاههای موجود، عدم پایان عمر مفید دستگاههای آنالوگ (با خروجی و ورودی آنالوگ) موجود و . . . و لزوم بکارگیری دستگاههای موجود و جدید با هم در بخشهای مختلف اغلب نیاز به واسطهایی است که ورودی و خروجیهای دستگاههای یک مجموعه را برای یکدیگر قابل استفاده نماید. بعبارت بهتر هر گاه سیگنال دریافتی در یک مقطع، بوسیله دستگاهها در مقطع بعدی بعلت عدم تطابق استاندارد سیگنال صدا و تصویر قابل استفاده نباشد نیازمند واسط یا واسطهایی خواهیم بود که مشکل عدم تطابق استاندارد را حل کنیم:
مقدمهای بر فلسفه وجودی AD و DA با نمایش شمایی از کاربردهای آنان
دو حوزه آنالوگ و دیجیتال بعلت عدم یکسانی استانداردشان نیازمند واسطی هستند که سیگنال آنالوگ را برای دستگاهی با ورودی دیجیتال و یا سیگنال دیجیتالی را برای دستگاهی با ورودی آنالوگ قابل فهم و استفاده نمایند. این مبدلها را بنام مبدل آنالوگ به دیجیتال (ADC یا AD) و مبدل دیجیتال به آنالوگ (DAC یا DA) مینامند.
بواسطه تنوع شکل سیگنال های دیجیتال و آنالوگ مورد استفاده، خود مبدلهای آنالوگ به دیجیتال و دیجیتال به آنالوگ نیز بر اساس شکل (نوع) ورودی و خروجیشان دسته بندی میشوند که این موضوع در هر قسمت بطور جداگانه و تا حد امکان کامل توضیح داده خواهد شد. مثال سادهای از نیاز به یک مبدل آنالوگ به دیجیتال و دیجیتال به آنالوگ در شکل زیر نمایش داده شدهاست: (لازم بذکر است در این مثال سیگنالهای تصویر، با قابلیت وضوح استاندارد یا اصطلاحاً (standard definition) هستند)
AD تصویر
یک مبدل AD تصویر بطور کلی بلوکی مانند شکل زیر است که همه یا ترکیبی از ورودیهایش را به همه یا ترکیبی از خروجیهایش تبدیل میکند:
همانطور که در این شکل مشاهده میشود ورودی میتواند
ترکیبی از سیگنالهای مرکب آنالوگ نظیر PAL SECAM، NTSC، مؤلفهای، RGB و
Y/C باشد. سیگنال مرجع نیز درصورت ایجاب طراحی، براساس تعریف کاربری توسط
سازنده مبدل قابل استفاده خواهد بود.
خروجی نیز میتواند ترکیبی از
سیگنال سریال دیجیتالی مؤلفهای (525 و 625) SDC یا SDI، سیگنال سریال
دیجیتالی مرکب(PAL یا NTSC) و موازی باشد. لازم بذکر است که امکان تبدیل
تعداد خط سیگنال از 625 به 525 و بعکس اغلب جزو امکانات AD محسوب نمیشود.
بنابراین تقریباً در تمام ADهای شناخته شده موجود در صورت تبدیل از آنالوگ
به دیجیتال، تعداد خط قابل تغییر نیست و این امکان بخشی از پردازش سیگنال
ویدئوی دیجیتال محسوب میشود.
بعلت استفاده عمومی کم از سیگنال
موازی دیجیتال (برای ارتباط بین دستگاهها)، این خروجی نیز معمولاً روی
ADهای معمولی وجود ندارد. علاوه بر ورودیهای فوق بعضی امکانات نیز بر حسب
طراحی سازنده بطور خودکار یا دستی در اختیار قرار میگیرند که از جمله آنها
میتوان از ورودی Ref، امکان تنظیم مشخصات سیگنال ویدئوی ورودی (رنگ،
روشنایی، سطح ویدئو و . . .)، خروجی سیگنال های وضعیت عملکرد برد (status،
alarm) ذخیره سازی سیگنال ورودی در حد فریم و . . . نام برد.
در
حوزه تصویر دیجیتال سریال دو نوع استاندارد مرکب و مؤلفهای داریم. در
سیگنال دیجیتال مرکب که اصطلاحاً 4fsc PAL و 4fsc NTSC گفته میشود و
همچنین استاندارد D2 (از شرکت سونی و امپکس) و D3 (از شرکت پاناسونیک)
سیگنال مرکب آنالوگ PAL یا NTSC مستقیماً با چهار برابر فرکانس حامل فرعی
(subcarrier) نمونهبرداری و بصورت 8 یا 10 بیتی کد میشود. این روش با
استاندارد SMPTE244 شناخته میشود. فرکانس نمونهبرداری برای سیستم NTSC
معادل Fs = 4fsc = 4 * 3.579525 =14.3181 و برای سیستم پال برابر 72/17 =
43 /4 * 4 = Fs = 4fsc است.
در روشهای موجود چه در حالت 8 و چه 10
بیتی تعدادی از کدها استفاده نمیشوند. یکی از کدها برای سطح سینک و تعدادی
نیز به محدوده حداکثر (headroom) و حداقل (اصطلاحاً footroom) اختصاص
یافته اند. با این تفاصیل و مقادیر عددی که در استانداردها قابل دسترسی است
مقدار سیگنال به نویز کوانتیزاسیون در سیستم NTSC با کدینگ 10 بیتی معادل
dB 1/68 و با کدینگ 8 بیتی معادل dB 06/56 است. با ظهور تجهیزات سریال
دیجیتال مؤلفهای با قیمت ارزانتر و بواسطه استفاده از سیگنال مؤلفهای با
کیفیت بهتر، این شیوه جایگزین شیوه سریال دیجیتال مرکب شد بطوریکه در
بسیاری از کشورها هیچ ردی از ورود و از رده خارج شدن تجهیزات دیجیتال مرکب
دیده نمیشود.
حداکثر سرعت داده در پال دیجیتال Mb/s 177 و در NTSC
دیجیتال Mb/s 143 است. در اروپا بعلت وجود سیستم سکام در بعضی کشورها روش
سریال دیجیتال مرکب نتوانست جائی باز کند.
در ادامه توضیح روشهای تبدیل آنالوگ به دیحیتال به روش دیگر که متداولتر است یعنی روش سریال دیجیتال مؤلفهای می پردازیم.
همانطور که از نام آن پیداست در این روش سیگنال آنالوگ ورودی به هر شکلی که باشد قبل یا حین یا پس از تبدیل شدن به دیجیتال (این امر بدلیل روشهای مختلف تبدیل سیگنال آنالوگ به دیجیتال است) جهت خارج شدن از سیستم بصورت دیجیتال مؤلفهای شکل داده میشود. براساس آنچه در ملاحظات استاندارد ITU-R BT. 601 ذکر شده است: توجه به نقاط مشترک در سیستمهای 625 خطه و 525 خطه، امکان تولید تجهیزات مختلف با امکانات مشترک و لذا سهولت تبادل تولیدات ویدئویی از جمله مزایای روش سریال دیجیتال مؤلفهای است.
بعلاوه در مقایسه با روش مرکب در صورتیکه منبع ها مؤلفهای باشد، (نظیر یک ویدئو کاست بتاکم یا دوربین) کیفیت روش مؤلفهای بهتر از روش مرکب خواهد بود. با روشی که بعداً ذکر خواهد شد مشکل استفاده از سیگنال مؤلفهای آنالوگ جهت انتقال، در روش دیجیتال، حل شدهاست. چون در فضای مؤلفهای آنالوگ نیاز به پهنایباند (بصورت فرکانسی یا فیزیکی!) بیشتری جهت انتقال وجود خواهد داشت و در حالت باند پایه مجبور به استفاده از سه کابل مجزا برای مؤلفههای روشنایی و اختلاف رنگ بودیم. در روش سیگنال دیجیتال مؤلفهای هر سه مؤلفه روی یک کابل و پشت سر هم انتقال می یابند.
این روش بر اساس فرکانس نمونهبرداری به دو بخش A و B
تقسیم می گردد. در بخش A که فرکانس نمونهبرداری آن MHz ۱۳/۵ است برای
تصاویر با نسبت ابعاد 4/3 و 9/16 و در بخش B با فرکانس نمونهبرداری MHz ۱۸
جهت حصول کیفیت (تفکیک) افقی بهتر در تصاویر 9/16 استفاده میشود.
از
آنجا که در فضای دیجیتال ما مجبور به جایگزینی نمونهها به جای سیگنال
آنالوگ هستیم لذا دارای تعدادی نمونه به ازای هر خط ویدئو خواهیم بود. این
تعداد برای سیستم 625 خط برای یک خط کامل 64 میکروثانیهای معادل 864 نمونه
(پیکسل) برای مؤلفه روشنایی در نظر گرفته شدهاست. لذا با فرض اینکه ما
برای سیگنال مؤلفة روشنایی در هر خط نیازمند 864 نمونه باشیم داریم:
5/13 (میلیون نمونه Y در هر ثانیه) = 864 (نمونه در هر خط) * 625 (خط) * 25 (فریم در هر ثانیه)
لذا
برای نمونهبرداری از سیگنال روشنایی نیاز به فرکانس نمونهبرداری MHz
5/13 داریم. با توجه به اهمیت کمتر مؤلفههای رنگ نسبت به روشنایی (بواسطه
پهنایباند و اطلاعات کمترشان) این فرکانس برای آنها، نصف MHz ۱۳/۵ یا
معادل MHz ۶/۷۵ میشود. با توجه به وجود 5/13 میلیون نمونه در ثانیه از
سیگنال روشنایی و 75/6 میلیون نمونه از هر کدام از مؤلفههای رنگ ( مجموع
5/13 میلیون نمونه مؤلفههای رنگ) در کل 27 میلیون نمونه در ثانیه از
سیگنال ویدئو برای سیگنال ویدئوی دیجیتال وجود دارد. در صورتیکه هر کدام از
نمونهها را با 10 بیت نمایش دهیم در هر ثانیه ما 270 میلیون بیت یا
بعبارت بهتر ۲۷۰ Mb/s خواهیم داشت. حال مراحل تبدیل سیگنال آنالوگ به
دیجیتال را با نمایش یک بلوک دیاگرام کلی نشان خواهیم داد:
حال هر کدام از اجزاء دیاگرام فوق را تشریح میکنیم:
اولین بلوک که بلوک عمومی تقریباً تمام ADها (تمام آن
یا بخشی از آن بلوک) است بلوکی است که سیگنال ورودی طبقه اصلی را فراهم
میکند. ADهای اولیه همگی برای انجام کار تبدیل سیگنال آنالوگ به دیجیتال
نیازمند سیگنال مؤلفهای بودند. لذا هر نوع سیگنال آنالوگ که به آن وارد
میشد باید بطریقی به سیگنال مؤلفهای تبدیل میشد. اگر این سیگنال، مرکب یا
Y/C بود اجباراً از بلوک دیکدر مربوط به سیستم خود باید عبور میکرد و اگر
RGB بود باید از یک ماتریس رنگ که تبدیل RGB به سیگنال مؤلفهای را انجام
می داد عبور مینمود. در بخشهایی از این بلوک جهت انتخاب ورودیهای قسمت بعد
در صورت تامین شدن آن از دو مسیر مختلف کلیدها یا جامپرهایی قرار میگیرد
که مسیر تامین سیگنال را مشخص میکند.
بلوک بعدی بلوک فیلتر است.
همانطور که می دانید فیلتر بلوکی است که به بخشهایی از سیگنال اجازه عبور
داده و مانع از عبور سایر بخشهای سیگنال میشود. اینکه به چه بخشهایی از
سیگنال اجازه عبور داده شود مشخص کننده نوع فیلتر خواهد بود. فیلترها بر
این اساس به فیلترهای پایینگذر، میانگذر، بالاگذر و میاننگذر تقسیم
میشوند. اثر این چهار نوع فیلتر در شکل زیر قابل مشاهده است:
به دو دلیل مؤلفههای سیگنال آنالوگ ورودی باید فیلتر
پایینگذر شوند، یکی جلوگیری از بروز پدیده الیاسینگ (رویهم افتادگی
سیگنالهای نمونهبرداری شده بواسطه عدم رعایت قانون نایکویست) و
دیگری جلوگیری از اثر انباشتگی نویز بواسطه تاخوردگی در محلهای فرکانس
نمونهبرداری (پدیده فولدینگ).
اگر بخاطر داشته باشیم، براساس قضیه
نایکویست حداقل فرکانس نمونهبرداری برای آشکارسازی صحیح سیگنال دیجیتال،
دو برابر پهنایباند سیگنال آنالوگ نمونهبرداری شونده است. این بدان معنی
است که سیگنالهای آنالوگی که پهنایباند محدودی ندارند قابل نمونهبرداری
نیستند مگر اینکه آنرا با یک فیلتر پایینگذر محدود کرد. در مورد سیگنال
ویدئو نیز همین امر صادق است. تا جایی که سیگنال ویدئو مؤلفه با ارزشی
دارد، مورد نیاز است از آن به بعد هم نویز و قسمتی از مؤلفههای غیر مورد
نیاز وجود دارد. لذا جهت جلوگیری از تاثیر این اجزاء و اینکه هر چه
پهنایباند ما بالاتر رود، فرکانس نمونهبرداری هم اجباراً بیشتر میشود و
هر چه فرکانس بالاتر رود طراحی و ساخت تجهیزات سخت تر و گرانتر خواهد شد.
لذا تا حد مورد نیاز، به سیگنال اجازه عبور داده میشود. جهت روشنتر شدن
مطالب فوق به شکل زیر توجه کنید:
مشکل دیگر درصورت عدم محدودکردن پهنایباند، پدیده تاخوردگی دنبالههای سیگنال روی فرکانس نمونهبرداری است. مشکل تاخوردگی بگونهای است که میتواند سیگنال اصلی را کلاً با نویز و بخشهای کم اهمیت سیگنال بپوشاند.
با توجه به توضیحات فوق مجبور به استفاده از فیلتر پایینگذر هستیم. پهنای فیلتر مورد نیاز به میزان اطلاعات موجود در سیگنال فیلتر شونده مربوط میشود. اگر پهنایباند سیگنال روشنایی را MHz ۵/۷۵ و پهنایباند هر کدام از مؤلفهای رنگ را MHz ۲/۷۵ فرض کنیم، فیلترهای پایینگذر استاندارد پیشنهاد شده برای هر کدام در زیر نمایش داده شدهاند:
اگر فرکانس نمونهبرداری دو برابر پهنایباند سیگنال در نظر گرفته شود تنها از لحاظ نظری (تئوری) میتوان سیگنال را درست آشکارسازی کرد (به آنالوگ تبدیل نمود) ولی از لحاظ عملی امکان پذیر نیست. لذا اغلب، فرکانس نمونهبرداری بیش از دو برابر پهنایباند سیگنال در نظر گرفته میشود. همانطوریکه از شکل استنتاج میشود فرکانس نمونهبرداری برای مؤلفه Y معادل MHz ۱۳/۵ = ۶/۷۵ * ۲ و برای مؤلفههای Cr و Cb معادل MHz ۶/۷۵ = ۳/۳۷۵ * ۲ است. در صورتیکه فرکانس MHz ۳/۳۷۵ را فرکانس پایه در نظر بگیریم خواهیم دید که فرکانسهای نمونهبرداری Y و Cr و Cb بترتیب 4، 2 و 2 برابر فرکانس پایه هستند.
بنابراین مفهوم 4:2:2 که اغلب با سیگنال دیجیتال سریال مؤلفهای و موازی استانداردِ ITU-R BT. 601 مطرح میشود از اینجا نشأت میگیرد و نشانگر اینست که تعداد نمونههای بدست آمده از سیگنال Y در هر زمان دو برابر تعداد نمونههای بدست آمده از مؤلفههای Cr یا Cb است. این امر به لحاظ اهمیت بیشتر مؤلفه Y، تاثیر کیفی بیشتر آن نسبت به Cr و Cb و ملاحظات اقتصادی است. لذا در جاهایی که کیفیت اقتضاء کند (نظیر دستگاههای تصحیح کننده رنگ دیجیتال) فرمت 4:4:4 نیز بطور استاندارد وجود دارد که نشانگر نمونهبرداری با فرکانس MHz ۱۳/۵ برای هر سه مؤلفه، بطور یکسان است.
سیگنال پس از فیلترشدن آماده نمونهبرداری میشود. در شکل زیر مثال سادهای از مراحل نمونهبرداری از یک سیگنال سینوسی نشان داده شدهاست:
در استاندارد 625 خط که هر خط 64 میکروثانیه است یا
بعبارتی فرکانس خط معادل KHz 15625 است در صورت نمونهبرداری با فرکانس MHz
۱۳/۵ و MHz ۶/۷۵ خواهیم داشت:
تعداد نمونه مؤلفه Y در هر خط 864 = 15625÷ 13,500,000
تعداد نمونه مؤلفه Cr در هر خط 432 = 15625 ÷ 6,750,000
تعداد نمونه مؤلفه Cb در هر خط 432 = 15625 ÷ 6,750,000
در سیستمهای با استاندارد 525 خط داریم (فرکانس خط حدود Hz ۱۵۷۳۴/۲۶ )داریم:
858 = 26/15734 ÷ 13,500,000
429 = 26/15734 ÷ 6,750,000
429 = 26/15734 ÷ 6,750,000
با
توجه به میزان فرکانس نمونهبرداری و اعداد فوق مشخص میشود به ازاء هر دو
نمونه از مؤلفه Y یک نمونه از مؤلفه Cr و یک نمونه از مؤلفه Cb وجود دارد.
یعنی از لحاظ پیکسلها شکل زیر را داریم:
برای هر دو استاندارد 525 و 625 خط تعداد پیکسلهای Y و Cr و Cb که بخش قابل دیدن (vision) هر خط را تشکیل می دهند عبارتند از :
720 نمونه از سیگنال Y به ازاء هر خط ( معادل 333/53 میکروثانیه)
360 نمونه از سیگنال Cr به ازاء هر خط
360 نمونه از سیگنال Cb به ازاء هر خط
و تعداد خطوط فعال هر فریم از سیگنال عبارتند از 576 خط برای استاندارد 625 خطی و 487 خط برای استاندارد 525 خطی.