فناوری اطلاعات و ارتباطات - ICT

مباحث پیشرفته رشته ICT و برق

فناوری اطلاعات و ارتباطات - ICT

مباحث پیشرفته رشته ICT و برق

مبانی صدا و تصویر دیجیتال

اگر دقت کرده باشید تاکنون در زندگی روزمره برای بیان و فهم پدیده‌های یکسانی، زبان‌ها و بیان‌های مختلفی وجود داشته است. زبان، خود مثال بارزی برای این موضوع است. مثلاً کلمات ”پنج ”، “5”، “Five”و ”بش” همه بیانگر یک واقعیت هستند. اگر دقت کنیم آنچه که روی لامپ تصویر یک مونیتور می بینیم هم بیان دیگر از همان سیگنالی است که روی Waveform می‌بینیم

یا آنچه که از یک باند می‌شنویم بیان دیگری ازهمان سیگنال صدایی است که می‌توانیم روی اسکوپ یا VU meter ببینیم یا عددی که روی صفحه نمایش یک ولت متر می بینیم بیان دیگری از اختلاف ولتاژ دو نقطه است. یا دمایی که یک دماسنج نمایش میدهد بیان دیگری از حرارت یک نقطه است که می‌توانیم با انگشت خود نیز آنرا احساس کنیم. شاید باور نکنید اگر ادعا کنیم ممکن است دو شکل‌موج زیر نیز دو بیان متفاوت از یک چیز یکسان باشند.

 

هدف از ذکر مثالهای فوق این بود که ادعا کنیم سیگنال دیجیتال هم بیان دیگری از چیزی است که با سیگنال آنالوگ آنرا بیان کرده بودیم. مثلاً خروجی آنالوگ و دیجیتال تصویر یک دوربین، دو بیان مختلف از یک چیز واحد هستند. در اینجا مهم این است که بیانهای متفاوت از یک چیز یکسان می‌توانند نسبت به همدیگر مزایا و یا معایبی داشته باشند.

مثلاً یادگیری زبان چینی و زبان انگلیسی را برای بیان یک چیز واحد تصور نمائید! آیا با همان راحتی که می‌توانیم عدد 17 را بفهمیم معادل لاتین آنرا یعنی “ XVII” را نیز می فهمیم یا معادل عربی آن را.

در سیستمهای اعداد نیز مبناهای مختلفی برای شمارش و اعمال ریاضی وجود دارد که در بین آنها سیستمهای مبنای ده (‌اعشاری، دسیمال )، مبنای 8 ( اکتال )،‌مبنای 16 (هگزادسیمال) و مبنای 2(باینری) مشهورترند.
از آنجاکه اعداد در مبنای 2، فقط از دو رقم 0 و 1 ( یا دو حالت صفر و یک یا دو سطح ولتاژ ) تشکیل شده‌اند، این مبنا برای سیستم دیجیتال انتخاب شده است. حال به بیان اعداد یکسان در دستگاههای مختلف شمارش می‌پردازیم:

 

کوچکترین واحد در اعداد باینری که می‌تواند صفر یا یک باشد را “بیت” (bit) می‌نامند. مجموعه‌ای از بیتها در کنار هم را یک کلمه (Word) می‌نامند. بطور خاص، یک کلمه که دارای 8 بیت باشد را یک بایت(Byte) می‌نامند.
معادل اعداد در مبنای 2، سیگنال الکتریکی وجود دارد که دارای دو سطح بالا بعنوان “1” و سطح پایین بعنوان “0” است. شکل زیر بیانگر رابطه بین شکل‌موج و کلمه باینری معادل آن است.

 

 میتوان اعداد در مبناهای مختلف را بهم تبدیل کرد. برای تبدیل اعداد در مبنای دهدهی به مبنای 2 به مثال زیر توجه فرمائید. فرض کنید می‌خواهیم عدد 18 در مبنای ده را به مبنای 2 تبدیل کنیم.


 

بر این مبنا روابط منطقی زیر تعریف شده است:

در مورد این گیت هر چیزی که با صفر OR شود خودش و هر چیزی که با یک OR شود یک می‌شود:

 

در مورد این گیت هر چیزی که با صفر AND شود صفر و هر چیزی که با یک AND شود خودش می‌شود:

 

متمم صفر، یک و متمم یک، صفر می‌شود:

 

در مورد این گیت هر چیزی که با صفر XOR شود خودش و هر چیزی که با یک XOR شود، متممش می‌شود:

 

متمم گیتهای فوق نیز به نامهای NOR، NAND و XNOR وجود دارد. گیت NOT خود متمم گیت بافر است:

 

گیتهای فوق، عناصر پایه‌ای ساخت تمام قطعات و مدارات دیجیتال هستند.

با حرکت به سمت و ورود به عرصه دیجیتال در صدا و تصویر، تنوع دستگاههای موجود، عدم پایان عمر مفید دستگاههای آنالوگ (با خروجی و ورودی آنالوگ) موجود و . . . و لزوم بکارگیری دستگاههای موجود و جدید با هم در بخشهای مختلف اغلب نیاز به واسطهایی است که ورودی و خروجیهای دستگاههای یک مجموعه را برای یکدیگر قابل استفاده نماید. بعبارت بهتر هر گاه سیگنال دریافتی در یک مقطع، ‌بوسیله دستگاهها در مقطع بعدی بعلت عدم تطابق استاندارد سیگنال صدا و تصویر قابل استفاده نباشد نیازمند واسط یا واسطهایی خواهیم بود که مشکل عدم تطابق استاندارد را حل کنیم:

مقدمه‌ای بر فلسفه وجودی AD و DA با نمایش شمایی از کاربردهای آنان

دو حوزه آنالوگ و دیجیتال بعلت عدم یکسانی استانداردشان نیازمند واسطی هستند که سیگنال آنالوگ را برای دستگاهی با ورودی دیجیتال و یا سیگنال دیجیتالی را برای دستگاهی با ورودی آنالوگ قابل فهم و استفاده نمایند. این مبدلها را بنام مبدل آنالوگ به دیجیتال (ADC یا AD) و مبدل دیجیتال به آنالوگ (DAC یا DA) می‌نامند.

بواسطه تنوع شکل سیگنال های دیجیتال و آنالوگ مورد استفاده، خود مبدلهای آنالوگ به دیجیتال و دیجیتال به آنالوگ نیز بر اساس شکل (نوع) ورودی و خروجیشان دسته بندی می‌شوند که ‌این موضوع در هر قسمت بطور جداگانه و تا حد امکان کامل توضیح داده خواهد شد. مثال ساده‌ای از نیاز به یک مبدل آنالوگ به دیجیتال و دیجیتال به آنالوگ در شکل زیر نمایش داده شده‌است: (لازم بذکر است در این مثال سیگنالهای تصویر، با قابلیت وضوح استاندارد یا اصطلاحاً (standard definition) هستند)

 

AD تصویر

یک مبدل AD تصویر بطور کلی بلوکی مانند شکل زیر است که همه یا ترکیبی از ورودیهایش را به همه یا ترکیبی از خروجیهایش تبدیل می‌کند:

 

همانطور که در این شکل مشاهده می‌شود ورودی می‌تواند ترکیبی از سیگنالهای مرکب آنالوگ نظیر PAL SECAM، NTSC، مؤلفه‌ای، RGB و Y/C باشد. سیگنال مرجع نیز درصورت ایجاب طراحی، براساس تعریف کاربری توسط سازنده مبدل قابل استفاده خواهد بود.

خروجی نیز می‌تواند ترکیبی از سیگنال سریال دیجیتالی مؤلفه‌ای (525 و 625) SDC یا SDI، سیگنال سریال دیجیتالی مرکب(PAL یا NTSC) و موازی باشد. لازم بذکر است که امکان تبدیل تعداد خط سیگنال از 625 به 525 و بعکس اغلب جزو امکانات AD محسوب نمی‌شود. بنابراین تقریباً در تمام ADهای شناخته شده موجود در صورت تبدیل از آنالوگ به دیجیتال، تعداد خط قابل تغییر نیست و این امکان بخشی از پردازش سیگنال ویدئوی دیجیتال محسوب می‌شود.

بعلت استفاده عمومی کم از سیگنال موازی دیجیتال (برای ارتباط بین دستگاهها)، این خروجی نیز معمولاً روی ADهای معمولی وجود ندارد. علاوه بر ورودیهای فوق بعضی امکانات نیز بر حسب طراحی سازنده بطور خودکار یا دستی در اختیار قرار می‌گیرند که از جمله آنها می‌توان از ورودی Ref‌، امکان تنظیم مشخصات سیگنال ویدئوی ورودی (رنگ، روشنایی، سطح ویدئو و . . .)، خروجی سیگنال های وضعیت عملکرد برد (status، alarm) ذخیره سازی سیگنال ورودی در حد فریم و . . . نام برد.

در حوزه تصویر دیجیتال سریال دو نوع استاندارد مرکب و مؤلفه‌ای داریم. در سیگنال دیجیتال مرکب که اصطلاحاً 4fsc PAL و 4fsc NTSC گفته می‌شود و همچنین استاندارد D2 (از شرکت سونی و امپکس) و D3 (از شرکت پاناسونیک) سیگنال مرکب آنالوگ PAL یا NTSC مستقیماً با چهار برابر فرکانس حامل فرعی (subcarrier) نمونه‌برداری و بصورت 8 یا 10 بیتی کد می‌شود. این روش با استاندارد SMPTE244 شناخته می‌شود. فرکانس نمونه‌برداری برای سیستم NTSC معادل Fs = 4fsc = 4 * 3.579525 =14.3181  و برای سیستم پال برابر 72/17 = 43 /4 * 4 = Fs = 4fsc  است.

در روشهای موجود چه در حالت 8 و چه 10 بیتی تعدادی از کدها استفاده نمی‌شوند. یکی از کدها برای سطح سینک و تعدادی نیز به محدوده حداکثر (headroom) و حداقل (اصطلاحاً footroom) اختصاص یافته اند. با این تفاصیل و مقادیر عددی که در استانداردها قابل دسترسی است مقدار سیگنال به نویز کوانتیزاسیون در سیستم NTSC با کدینگ 10 بیتی معادل dB 1/68 و با کدینگ 8 بیتی معادل dB 06/56 است. با ظهور تجهیزات سریال دیجیتال مؤلفه‌ای با قیمت ارزانتر و بواسطه استفاده از سیگنال مؤلفه‌ای با کیفیت بهتر، این شیوه جایگزین شیوه سریال دیجیتال مرکب شد بطوریکه در بسیاری از کشورها هیچ ردی از ورود و از رده خارج شدن تجهیزات دیجیتال مرکب دیده نمی‌شود.
حداکثر سرعت داده در پال دیجیتال Mb/s 177 و در NTSC دیجیتال Mb/s 143 است. در اروپا بعلت وجود سیستم سکام در بعضی کشورها روش سریال دیجیتال مرکب نتوانست جائی باز کند.

در ادامه توضیح روشهای تبدیل آنالوگ به دیحیتال به روش دیگر که متداولتر است یعنی روش سریال دیجیتال مؤلفه‌ای می پردازیم.

 همانطور که از نام آن پیداست در این روش سیگنال آنالوگ ورودی به هر شکلی که باشد قبل یا حین یا پس از تبدیل شدن به دیجیتال (این امر بدلیل روشهای مختلف تبدیل سیگنال آنالوگ به دیجیتال است) جهت خارج شدن از سیستم بصورت دیجیتال مؤلفه‌ای شکل داده می‌شود. براساس آنچه در ملاحظات استاندارد ITU-R BT. 601 ذکر شده ‌است:‌ توجه به نقاط مشترک در سیستم‌های 625 خطه و 525 خطه، امکان تولید تجهیزات مختلف با امکانات مشترک و لذا سهولت تبادل تولیدات ویدئویی از جمله مزایای روش سریال دیجیتال مؤلفه‌ای است.

بعلاوه در مقایسه با روش مرکب در صورتیکه منبع ها مؤلفه‌ای باشد، (‌نظیر یک ویدئو کاست بتاکم یا دوربین) کیفیت روش مؤلفه‌ای بهتر از روش مرکب خواهد بود. با روشی که بعداً ذکر خواهد شد مشکل استفاده از سیگنال مؤلفه‌ای آنالوگ جهت انتقال، در روش دیجیتال، حل شده‌است. چون در فضای مؤلفه‌ای آنالوگ نیاز به پهنای‌باند (بصورت فرکانسی یا فیزیکی!) بیشتری جهت انتقال وجود خواهد داشت و در حالت باند پایه مجبور به استفاده از سه کابل مجزا برای مؤلفه‌های روشنایی و اختلاف رنگ بودیم. در روش سیگنال دیجیتال مؤلفه‌ای هر سه مؤلفه روی یک کابل و پشت سر هم انتقال می یابند.

این روش بر اساس فرکانس نمونه‌برداری به دو بخش A و B تقسیم می گردد. در بخش A که فرکانس نمونه‌برداری آن MHz ۱۳/۵ است برای تصاویر با نسبت ابعاد 4/3 و 9/16 و در بخش B با فرکانس نمونه‌برداری MHz ۱۸ جهت حصول کیفیت (تفکیک) افقی بهتر در تصاویر 9/16 استفاده می‌شود.
از آنجا که در فضای دیجیتال ما مجبور به جایگزینی نمونه‌ها به جای سیگنال آنالوگ هستیم لذا دارای تعدادی نمونه به ازای هر خط ویدئو خواهیم بود. این تعداد برای سیستم 625 خط برای یک خط کامل 64 میکروثانیه‌ای معادل 864 نمونه (پیکسل) برای مؤلفه روشنایی در نظر گرفته شده‌است. لذا با فرض اینکه ما برای سیگنال مؤلفة روشنایی در هر خط نیازمند 864 نمونه باشیم داریم:

 5/13 (میلیون نمونه Y در هر ثانیه) = 864 (نمونه در هر خط) *  625 (خط) * 25 (فریم در هر ثانیه)

لذا برای نمونه‌برداری از سیگنال روشنایی نیاز به فرکانس نمونه‌برداری MHz 5/13 داریم. با توجه به اهمیت کمتر مؤلفه‌های رنگ نسبت به روشنایی (بواسطه پهنای‌باند و اطلاعات کمترشان) این فرکانس برای آنها، نصف MHz ۱۳/۵ یا معادل MHz ۶/۷۵ می‌شود. با توجه به وجود 5/13 میلیون نمونه در ثانیه از سیگنال روشنایی و 75/6 میلیون نمونه از هر کدام از مؤلفه‌های رنگ ( مجموع 5/13 میلیون نمونه مؤلفه‌های رنگ) در کل 27 میلیون نمونه در ثانیه از سیگنال ویدئو برای سیگنال ویدئوی دیجیتال وجود دارد. در صورتیکه هر کدام از نمونه‌ها را با 10 بیت نمایش دهیم در هر ثانیه ما 270 میلیون بیت یا بعبارت بهتر ۲۷۰ Mb/s خواهیم داشت. حال مراحل تبدیل سیگنال آنالوگ به دیجیتال را با نمایش یک بلوک دیاگرام کلی نشان خواهیم داد:

حال هر کدام از اجزاء دیاگرام فوق را تشریح می‌کنیم:

اولین بلوک که بلوک عمومی تقریباً تمام ADها (تمام آن یا بخشی از آن بلوک) است بلوکی است که سیگنال ورودی طبقه اصلی را فراهم می‌کند. ADهای اولیه همگی برای انجام کار تبدیل سیگنال آنالوگ به دیجیتال نیازمند سیگنال مؤلفه‌ای بودند. لذا هر نوع سیگنال آنالوگ که به آن وارد میشد باید بطریقی به سیگنال مؤلفه‌ای تبدیل میشد. اگر این سیگنال، مرکب یا Y/C بود اجباراً از بلوک دیکدر مربوط به سیستم خود باید عبور می‌کرد و اگر RGB بود باید از یک ماتریس رنگ که تبدیل RGB به سیگنال مؤلفه‌ای را انجام می داد عبور می‌نمود. در بخشهایی از این بلوک جهت انتخاب ورودیهای قسمت بعد در صورت تامین شدن آن از دو مسیر مختلف کلیدها یا جامپرهایی قرار می‌گیرد که مسیر تامین سیگنال را مشخص می‌کند.

بلوک بعدی بلوک فیلتر است. همانطور که می دانید فیلتر بلوکی است که به بخشهایی از سیگنال اجازه عبور داده و مانع از عبور سایر بخشهای سیگنال می‌شود. اینکه به چه بخشهایی از سیگنال اجازه عبور داده شود مشخص کننده نوع فیلتر خواهد بود. فیلترها بر این اساس به فیلترهای پایین‌گذر، میانگذر، بالاگذر و میان‌نگذر تقسیم می‌شوند. اثر این چهار نوع فیلتر در شکل زیر قابل مشاهده است:

به دو دلیل مؤلفه‌های سیگنال آنالوگ ورودی باید فیلتر پایین‌گذر شوند، یکی جلوگیری از بروز پدیده الیاسینگ (‌رویهم افتادگی سیگنالهای نمونه‌برداری شده بواسطه عدم رعایت قانون نایکویست) و دیگری جلوگیری از اثر انباشتگی نویز بواسطه تاخوردگی در محلهای فرکانس نمونه‌برداری (پدیده فولدینگ).

اگر بخاطر داشته باشیم، براساس قضیه نایکویست حداقل فرکانس نمونه‌برداری برای آشکارسازی صحیح سیگنال دیجیتال، دو برابر پهنای‌باند سیگنال آنالوگ نمونه‌برداری شونده است. این بدان معنی است که سیگنالهای آنالوگی که پهنای‌باند محدودی ندارند قابل نمونه‌برداری نیستند مگر اینکه آنرا با یک فیلتر پایین‌گذر محدود کرد. در مورد سیگنال ویدئو نیز همین امر صادق است. تا جایی که سیگنال ویدئو مؤلفه با ارزشی دارد، مورد نیاز است از آن به بعد هم نویز و قسمتی از مؤلفه‌های غیر مورد نیاز وجود دارد. لذا جهت جلوگیری از تاثیر این اجزاء و اینکه هر چه پهنای‌باند ما بالاتر رود، ‌فرکانس نمونه‌برداری هم اجباراً بیشتر می‌شود و هر چه فرکانس بالاتر رود طراحی و ساخت تجهیزات سخت تر و گرانتر خواهد شد. لذا تا حد مورد نیاز، به سیگنال اجازه عبور داده می‌شود. جهت روشن‌تر شدن مطالب فوق به شکل زیر توجه کنید:

مشکل دیگر درصورت عدم محدودکردن پهنای‌باند، پدیده تاخوردگی دنباله‌های سیگنال روی فرکانس نمونه‌برداری است. مشکل تاخوردگی بگونه‌ای است که می‌تواند سیگنال اصلی را کلاً با نویز و بخشهای کم اهمیت سیگنال بپوشاند.

 

با توجه به توضیحات فوق مجبور به استفاده از فیلتر پایین‌گذر هستیم. پهنای فیلتر مورد نیاز به میزان اطلاعات موجود در سیگنال فیلتر شونده مربوط می‌شود. اگر پهنای‌باند سیگنال روشنایی را MHz ۵/۷۵ و پهنای‌باند هر کدام از مؤلفهای رنگ را MHz ۲/۷۵ فرض کنیم، فیلترهای پایین‌گذر استاندارد پیشنهاد شده برای هر کدام در زیر نمایش داده شده‌اند:

اگر فرکانس نمونه‌برداری دو برابر پهنای‌باند سیگنال در نظر گرفته شود تنها از لحاظ نظری (تئوری) می‌توان سیگنال را درست آشکارسازی کرد (به آنالوگ تبدیل نمود) ولی از لحاظ عملی امکان پذیر نیست. لذا اغلب، فرکانس نمونه‌برداری بیش از دو برابر پهنای‌باند سیگنال در نظر گرفته می‌شود. همانطوریکه از شکل استنتاج می‌شود فرکانس نمونه‌برداری برای مؤلفه Y معادل MHz ۱۳/۵ = ۶/۷۵ * ۲ و برای مؤلفه‌های Cr و Cb معادل MHz ۶/۷۵ = ۳/۳۷۵ * ۲ است. در صورتیکه فرکانس MHz ۳/۳۷۵ را فرکانس پایه در نظر بگیریم خواهیم دید که فرکانس‌های نمونه‌برداری Y و Cr و Cb بترتیب 4، 2 و 2 برابر فرکانس پایه هستند.

بنابراین مفهوم 4:2:2 که اغلب با سیگنال دیجیتال سریال مؤلفه‌ای و موازی استانداردِ ITU-R BT. 601 مطرح می‌شود از اینجا نشأت می‌گیرد و نشانگر اینست که تعداد نمونه‌های بدست آمده از سیگنال Y در هر زمان دو برابر تعداد نمونه‌های بدست آمده از مؤلفه‌های Cr یا Cb است. این امر به لحاظ اهمیت بیشتر مؤلفه Y، تاثیر کیفی بیشتر آن نسبت به Cr و Cb و ملاحظات اقتصادی است. لذا در جاهایی که کیفیت اقتضاء کند (نظیر دستگاههای تصحیح کننده رنگ دیجیتال) فرمت 4:4:4 نیز بطور استاندارد وجود دارد که نشانگر نمونه‌برداری با فرکانس MHz ۱۳/۵ برای هر سه مؤلفه، بطور یکسان است.

سیگنال پس از فیلترشدن آماده نمونه‌برداری می‌شود. در شکل زیر مثال ساده‌ای از مراحل نمونه‌برداری از یک سیگنال سینوسی نشان داده شده‌است:

در استاندارد 625 خط که هر خط 64 میکروثانیه است یا بعبارتی فرکانس خط معادل KHz 15625 است در صورت نمونه‌برداری با فرکانس MHz ۱۳/۵ و MHz ۶/۷۵ خواهیم داشت:
تعداد نمونه مؤلفه Y در هر خط 864 = 15625÷ 13,500,000
تعداد نمونه مؤلفه Cr در هر خط 432 = 15625 ÷ 6,750,000
تعداد نمونه مؤلفه Cb در هر خط 432 = 15625 ÷ 6,750,000
در سیستم‌های با استاندارد 525 خط داریم (‌فرکانس خط حدود Hz ۱۵۷۳۴/۲۶ )‌داریم:
858 = 26/15734 ÷ 13,500,000
429 = 26/15734 ÷ 6,750,000
429 = 26/15734 ÷ 6,750,000

با توجه به میزان فرکانس نمونه‌برداری و اعداد فوق مشخص می‌شود به ازاء هر دو نمونه از مؤلفه Y یک نمونه از مؤلفه Cr و یک نمونه از مؤلفه Cb وجود دارد. یعنی از لحاظ پیکسلها شکل زیر را داریم:

برای هر دو استاندارد 525 و 625 خط تعداد پیکسلهای Y و Cr و Cb که بخش قابل دیدن (vision) هر خط را تشکیل می دهند عبارتند از :
720 نمونه از سیگنال Y به ازاء هر خط ( معادل 333/53 میکروثانیه)
360 نمونه از سیگنال Cr به ازاء هر خط
360 نمونه از سیگنال Cb به ازاء هر خط
و تعداد خطوط فعال هر فریم از سیگنال عبارتند از 576 خط برای استاندارد 625 خطی و 487 خط برای استاندارد 525 خطی.


نظرات 0 + ارسال نظر
برای نمایش آواتار خود در این وبلاگ در سایت Gravatar.com ثبت نام کنید. (راهنما)
ایمیل شما بعد از ثبت نمایش داده نخواهد شد