كيف تعمل سماعات البلوتوث

بالنسبة لمعظمنا يعدُّ أمر كيفية عمل السماعات اللاسلكية لغزًا كاملاً، بخصوص السماعات السلكيّة فمن المنطقيّ أن تتدفق الكهرباء من هاتفك الذكيّ عبر الأسلاك المتشابكة إلى سماعات الرأس، ولكن مع سماعات الرأس اللاسلكيّة، كيف يتم نقل صوت الموسيقى المفضّل لديك أو البودكاست من هاتفك الذكيّ عبر الهواء إلى سماعات الأذن اللاسلكيّة هذه، سنقوم في هذا المقال بالإجابة على جزءٍ من هذا السؤال،

كيف تعمل سماعة البلوتوث

سماعات الرأس اللاسلكيّة معقدةٌ بشكلٍ لا يصدّق، إذ يوجد داخل سماعات الأذن البلاستيكيّة الصغيرة هذه تسع تقنياتٍ متميزةٍ سنستكشفها، ألا وهي مكبرات الصوت، برامج ترميز الصوت، البلوتوث، النظام الموجود على شريحةٍ أو SoC، لوحة الدوائر المطبوعة أو PCB، بطارية ليثيوم أيون، ميكروفونات MEMS وجهاز إلغاء الضوضاء.

سنركز في هذا المقال على الترميزات الصوتيّة Codec وسنستكشف كيف يمكن تمثيل الموجات الصوتيّة رقميًا باستخدام مجموعةٍ من الأرقام فقط، سيتم تقسيم هذا المقال إلى أربعة أجزاء:

سنقوم بفتح السماعات ونستكشف المكونات المختلفة ومكان تواجدها.
سنقدِّم لك نظرةً عامةً حول كيفيّة عمل سماعات الأذن هذه.
ثم سنستكشف أساسيات كيفيّة تحويل الموجات الصوتيّة لمعلوماتٍ رقميّةٍ باستخدام الأرقام وحدها.
بالإضافة إلى مناقشةٍ موجزةٍ حول تنسيقات الملفات الصوتيّة.

كيفية عمل سماعات البلوتوث

دعونا نلقي نظرةً من الداخل، تحت القطعة البلاستيكيّة الخارجيّة وغطاء الغبار الشبكيّ، لدينا غلافٌ واقيٌ مطاطيٌّ وأسفل هذه المجموعات من الأغطية مكبر الصوت الذي يولِّد الصوت بمكوناته الأربعة الرئيسيّة، الغشاء، المعلّق أو العنكبوت، الملف الصوتي والمغناطيس، ونجد خلف مكبر الصوت بعض الدوائر المعقّدة للغاية مطويةً في حزمةٍ صغيرةٍ جدًا.

مكونات سماعة البلوتوث

دعونا نسحب الدوائر ونرى ما الذي يجعل سماعات الأذن هذه تنبض، إن هذه الدوائر هي في الأساس ثلاث لوحات دوائر مطبوعةٍ مطويةٍ بدقةٍ في سماعة الأذن مع أسلاك مرنة تربطها لإنشاء PCB واحدة، نجد على اللوحة العلوية التي تم لصقها على الجانب الخلفيّ من مكبر الصوت نقطتين حيث يتصل مكبر الصوت مع شريحةٍ دقيقةٍ أكبر تتعامل مع اتصال البلوتوث وتقوم بفكِّ تشفير تدفق الصوت المضغوط المرسل من الهاتف الذكيّ،

لدينا أيضًا مجموعةٌ من مقاييس التسارع إلى جانب SoC قابلة للبرمجة، تتصل لوحة الدائرة هذه بلوحة الدائرة الثانية وتنطوي عليها، تحتوي الدائرة الثانية على شريحة منخفضة الطاقة لمعالجة الصوت المجسّم أو ترميز الصوت، يتصل بهذه الدائرة سلكٌ مسطّحٌ للهوائيّ يقع بجوار البطارية، وميكروفون موجودٌ في الجزء الخلفيّ من سماعة الأذن يُستخدم لتقليل الضوضاء ولوحة دائرةٍ ثالثةٍ متصلةٌ بالبطارية،

يوجد أسفل البطارية لوحة دوائر صغيرةٍ إضافيةٍ تحتوي على ميكروفون MEMS الرئيسيّ الذي يبلغ حجمه تقريبًا حجم حبة أرزّ، ويوجد أسفله غطاءٌ شبكيٌّ للغبار، بالإضافة إلى توصيلات لشحن سماعات الأذن.

إنه حقًا لقدرٌ مذهلٌ من الهندسة التي استعملت لجعل سماعات الأذن هذه خفيفة الوزن للغاية وصغيرةٌ جدًا بشكلٍ هائل.

كيف تعمل مكونات سماعة البلوتوث

الآن بعد أن رأينا كل ما هو موجود داخل سماعات الأذن، دعونا نتحدث عن كيفية عملها، عند تشغيل سماعات الرأس اللاسلكيّة المقترنة بالفعل بالقرب من هاتفك الذكيّ، يتم إنشاء قناة اتصال بلوتوث من أجل إرسال المعلومات ذهابًا وإيابًا بمجرد بدء تشغيلك للموسيقى أو البودكاست، يلتقط هاتفك الذكيّ البيانات الصوتيّة من شريحة تخزين الفلاش الخاصة به، ويقوم بفكِّ ضغط الصوت وتخزينه في ذاكرة العمل بهاتفك،

يمثّل هذا الصوت رقميًا بمجموعةٍ طويلةٍ من الأرقام، ولكي يرسلها إلى سماعات الأذن الخاصة بك يقوم هاتفك الذكيّ بضغط المعلومات وتقسيمها إلى حزمٍ وفقًا لمواصفات البلوتوث، بعد ذلك يقوم هاتفك الذكيّ بتحويل هذه الحزم إلى موجاتٍ كهرومغناطيسيّةٍ أو فوتوناتٍ ويرسل البيانات إلى سماعات الأذن عبر اتصال البلوتوث، لتستقبل سماعات الأذن البيانات وتفكّكها وتفكّ ضغط الحزم مرةً أخرى إلى مجموعاتٍ طويلةٍ من القيم،

تشفير و نقل الصوت

لترسل هذه القيم إلى برنامج الترميز الصوتيّ Codec الذي يحوّل القيم الرقميّة إلى شكل موجةٍ كهربائيّةٍ تناظريّة، ترسل إلى الملف الصوتيّ المتصل بالجزء الخلفيّ من الغشاء حيث يتحرّك الملف الصوتيّ ذهابًا وإيابًا اعتمادًا على الشكل الموجيّ المحدد ليتحرك الغشاء أيضًا فيولّد موجات ضغطٍ في الهواء، فتستشعر أذنك موجات الضغط هذه ليقوم دماغك بتفسيرها على أنها صوت.

ما هو برنامج الترميز الصوتي Codec

يرمز الكوديك إلى التشفير وفكّ التشفير وبشكلٍ عام فهو إما جزءٌ من برنامجٍ أو جهازٌ يقوم بتحويل البيانات أو المعلومات من تنسيقٍ إلى تنسيقٍ آخر وبالتالي ضغط البيانات أو فكّ ضغطها، في السيناريو الذي تحدثنا عنه للتو يقوم برنامج ترميز الصوت بتحويل بيانات الموسيقى أو البودكاست من مجموعة القيم الرقميّة إلى شكل موجةٍ تناظريّ، هذه هي عملية فكّ تشفير الملف الصوتيّ، في هذا السيناريو يقوم برنامج الترميز بإجراء تحويل رقميٍّ إلى تناظريٍّ أوDAC ،

ولكن يمكن لبرامج ترميز الصوت أيضًا القيام بالعكس عن طريق تشفير الإشارة التناظريّة من الميكروفون إلى مجموعةٍ رقميّةٍ من القيم وهو تحويلٌ تناظريٌّ إلى رقميّ أو ADC، يستخدم برنامج الترميز في كلِّ جزء من التكنولوجيا التي نستخدمها لتحويل أنواعٍ معينةٍ من البيانات إلى أنواع أخرى من خلال ضغط البيانات أو فكّ ضغطها.

كيفية تحويل الموجات الصوتية التناظرية إلى رقمية 10010

الآن بعد أن أصبح لدينا نظرة عامة مفاهيمية، دعنا نلقي نظرةً على كيفية تحويل شكل موجة الصوت التناظريّة وتمثيلها بالواحدات والأصفار، إليك شكل موجة صوتٍ تناظريٍّ به بعض القمم والقيعان، وتحوي تفاصيل هائلة، اعتمادًا على طول الملف الصوتيّ، يمكن أن تصبح مدتها طويلةً جدًا، فكيف يمكن تحويل شكل الموجة الصوتيّة هذه إلى قائمة طويلة من الأرقام؟

شكل الموجة الصوتية

قد تعتقد أنها تتضمن بعض الرياضيات المجنونة مع الكثير من الجيب وجيب التمام إلى جانب المعادلات متعددة المتغيرات ولكنها في الواقع أقلّ تعقيدًا من ذلك، حيث يتم وضع موجة الصوت التناظريّة على رسمٍ بيانيٍّ ويتم وضع جميع القيم التي تمر عبرها خلال فترةٍ زمنيةٍ محددةٍ في قائمة، لنحصل على نسخةٍ رقميّةٍ من شكل موجة الصوت، ألا وهي قائمةٌ طويلةٌ من القيم التي تمرعبرها الموجة،

تمثيل موجة الصوت على خطي x y

لدينا في هذا السيناريو 23 ميكروثانية بين كلِّ نقطة بيانات، عندما يتم تغذية المعلومات الرقميّة أو القائمة الطويلة من الأرقام إلى برنامج ترميز الصوت يقوم البرنامج برسم جميع النقاط على الرسم البيانيّ، وربط النقاط وتشكيل خطٍ أملسٍ بينها، ثم يرسل الشكل الموجيّ التناظريّ إلى مكبر الصوت ليقوم بتوليد الصوت.

في الواقع إن قمت بفتح ملفٍ صوتيٍّ في برنامجٍ لتحرير الصوت وتكبيره، فستتمكن من رؤية جميع النقاط التي تشكِّل ذلك الصوت، ملف الموسيقى أو بيانات البودكاست ليست شكل موجةٍ تناظريّةٍ إنما هي مجرد مجموعةٍ طويلةٍ من النقاط المتباعدة بشكلٍ متساوٍ مع القيم المرتبطة بها.

عملية تحويل شكل موجةٍ تناظريّةٍ إلى مجموعةٍ من الأرقام يسمى الرقمنة أو التحويل التناظريّ إلى الرقميّ وهذا هو المفهوم الأساسيّ.

تمثيل الصوت رقميًا وضبط تردداته

هناك جانبان رئيسيان ينبغي تبيانهما فيما يتعلق بهذا النظام، أولاً على هذا الرسم البيانيّ، محور السينات X هو الوقت وكما ذكرنا كلّ نقطة بياناتٍ أو عينةٍ من شكل موجة الصوت التناظريّة تفصل بينها 23 ميكروثانية، وإذا أردنا أن يكون التباعد أصغر، لنفترض بمقدار واحد ميكروثانية بين القيم والتي من شأنها أن تنتج مليون عينةٍ في كل ثانية أو معدل أخذ عينات بمقدار مليون هرتز.
وكذلك ملفاتٍ صوتيّةٍ تزيد مساحتها عن مئة ميغابايت لمدة 60 ثانية من الصوت، لكن لماذا 23 ميكروثانية؟

الإجابة المختصرة أن التباعد بين كلِّ نقطة بياناتٍ يعتمد بشكلٍ مباشرٍ على قدرة الأذن البشريّة على إدراك الصوت، يمكن للأذن البشريّة سماع أصواتٍ تصل إلى حوالي 20 كيلوهرتز أو موجةٍ واحدةٍ كلَّ 50 ميكروثانية، إذا كانت الموجات أقرب من بعضها البعض بهذه الطريقة سيكون للصوت ترددٌ أعلى ولن يتمكن البشر من السماع،

ترددات الأذن البشرية

قرر العلماء والمهندسون إهمال الترددات التي لا يستطيع البشر سماعها، لذلك من أجل التقاط شكل موجةٍ بترددٍ أقصى يبلغ 20 كيلوهرتز يلزم وجود نقطتيّ بيانات لكل موجةٍ كاملة، وبالتالي يستخدمون نقطة بياناتٍ واحدةٍ كلَّ 23 ميكروثانية، وهو معدل 44.1 كيلوهرتز أو 44100 عينةٍ في كلِّ ثانية،

لاحظ أن تردد أخذ العينات البالغ 44.1 كيلوهرتز هو المعدل الأكثر شيوعًا للصوت المسجّل مثل الموسيقى والبودكاست و48 كيلوهرتز هو ثاني أكثر المعدلات شيوعًا.

لماذا التردد 44.1 أو 48 هرتز هو الأكثر شيوعا في الملفات الصوتية

دعونا نعود إلى قائمتنا الطويلة من القيم الرقمية التي تمثِّل شكل الموجة التناظريّة، وسؤالنا التالي هو كيف نمثّل هذه القيم بنظام العدّ الثنائيّ؟ أو بشكلٍ أساسيٍّ كم عدد الواحدات أو الأصفار التي سنستخدمها لكلِّ عينة؟

دعنا نحاول تمثيل كلِّ عينةٍ باستخدام بتٍ واحدٍ إما واحدٍ أو صفر، للقيام بذلك لنأخذ شكل الموجة الأصليّ ونقم بتعيين كلِّ عينة إما 1 أو 0 وهنا لدينا البيانات الرقميّة الناتجة، ولكن ما مدى دقة تحويلنا التناظريّ إلى رقميّ؟ للتحقق نقوم بإعادة تجميع الرسم البيانيّ باستخدام هذه القيم، واحدٌ في الأعلى هنا، وصفرٌ في الأسفل هنا

الموجة الصوتية بعمق بت واحد فقط إما 0 أو 1

ورسم خطًا بين النقاط ليتشكّل لدينا شكل موجةٍ تناظريٍّ تم إنشاؤه من البيانات الرقميّة التي تم إنشاؤها من شكل موجة الصوت الأصليّ، لكن أبدًا لا يبدو هذا الإنشاء مثل الصوت الأصليّ، وبالتالي بتٌ واحدٌ ليس جيدًا بما يكفي، لذلك لنفترض أننا نستخدم اثنين من البتات، مما يعني أن كلّ عينةٍ يمكن أن تكون واحدةٌ من أربع قيمٍ مختلفة،

فلنأخذ الصوت الأصليّ ونحول كلّ قيمة إلى أقرب بتتين مكافئين، وهنا لدينا مجموعةٌ طويلةٌ من القيم، عند إعادة تشكيل الصوت سنرسمه مرةً أخرى ونجمع النقاط على الرسم البيانيّ ونرسم خطًا بينها، ولكنه لا يزال يبدو سيئًا للغاية حيث لا يتطابق حقًا مع شكل الموجة الأصليّ.

الموجة الصوتية بعمق 2 بت

ما هو العدد الأمثل للقيم في المحور العامودي لتمثيل الأصليّ بدقة

الإجابة تختلف حيث أن القرص الصوتيّ المضغوط على سبيل المثال يستخدم 16 بت لكلّ عينةٍ واحدة، ولأجل 16 بت مما يعني أن هناك 2 قوة 16 أو 65536 قيمةٍ مختلفةٍ على طول المحور Y أو باستخدام المصطلحات التقنيّة نقول إن ملفنا الصوتيّ يحتوي على عمق بتٍ يبلغ 16 بتًا، وتسمى عملية تحويل الإشارة التناظريّة إلى مجموعةٍ من القيم بالتكميم،

ويطلق على تعيين البتات لكل قيمة اسم التضمين النبضي المُرمّز PCM، برغم أن عمق بت الصوت البالغ 16 بتًا أمرٌ شائعٌ جدًا، إلا أنه تستخدم ملفات الصوت عالية الجودة 24 أو 32 بتًا لكلِّ عينة أو أعلى. إن أتيت إلى هذا المقال تتساءل عن:

MP3
AAC
WAV
FLAC
أو تنسيقات الملفات الصوتيّة الأخرى، فسنتحدث عنها باختصارٍ هنا،

بيانات الصوت الرقميّة وهي هذه القائمة الطويلة المكونة من 16 قيمة بت عند 44.1 كيلوهرتز غير مضغوطة وتشغل مساحةً كبيرةً تبلغ حوالي 10 ونصف ميغابايت لكل 60 ثانية من الملفات الصوتيّة ثنائيّة القناة، بينما ملفات MP3 الاستريو بمعدّل 320 كيلوبت في الثانية تنقص حجم الملف إلى حوالي 2.4 ميغابايت عن طريق معالجة كلِّ ميلي ثانية من الصوت والعثور على عناصر في الصوت غير المضغوط والتي لا يجيد البشر سماعها.

تجد هذه الخوارزميّة الصوتيّة العناصر ذات مستوى الصوت المنخفض بشكلٍ استثنائيّ، والأصوات ذات النغمات العاليّة جدًا أو الأصوات القريبة جدًا من بعضها ليقوم ضغط MP3 بتجاهلها مما يوفِّر المساحة، بينما تنسيقات الضغط غير المضيّعة للبيانات مثل .alac أو .flac لا تتجاهل أيّ بيانات، بل تقوم بالضغط من خلال البحث عن أنماطٍ أو بياناتٍ زائدةٍ عن الحاجة وتمثيل تلك الأنماط بشكلٍ أكثر كفاءة مما يحدث عندما يكون الصوت غير مضغوط.

المصدر Branch Education