صحبت کردن بدون تارهای صوتی با برچسب هوش مصنوعی

آینده جهان با هوش مصنوعی (۱۴۱)؛

محققان با تولید برچسب هوش مصنوعی امکان صحبت کردن افرادی که ناهنجاری‌های صوتی دارند را فراهم کردند.

به گزارش خبرگزاری علم و فناوری آنا به نقل از اینترستینگ اینجینرینگ، صحبت کردن اغلب برای افرادی که ناهنجاری‌های صوتی دارند، از جمله کسانی که بیماری‌های پاتولوژیک تار‌های صوتی دارند یا پس از انجام عمل‌های سرطان حنجره در حال بهبودی هستند، چالش برانگیز یا غیرممکن است.

برای کمک به چنین مواردی، محققان دانشگاه «یو سی ال ای» (UCLA) ابزاری سبک، انعطاف‌پذیر و نرم ساخته‌اند که کمی بزرگ‌تر از یک اینچ مربع است که با نصب بر روی پوست گلو به افرادی که تار‌های صوتی ناقص دارند کمک کند تا توانایی صحبت کردن خود را بازیابی کنند.

با کمک فناوری یادگیری ماشینی، این دستگاه می‌تواند سیگنال‌های ماهیچه‌های حنجره متحرک فرد را با دقت تقریباً ۹۵ درصد به گفتار قابل شنیدن تفسیر کند.

گروه مهندسی دانشکده ساموئلی یو سی ال‌ای قبلاً دستکش پوشیدنی ایجاد کرده بود که می‌توانست گفتار زبان اشاره آمریکایی (ASL) را به زبان انگلیسی ترجمه کند و ارتباط بین کاربران را تسهیل کند. جزئیات تحقیق این محققان در مجله نیچر کامیونیکشنزمنتشر شده است.

تبدیل سیگنال‌ حرکتی ماهیچه‌ها به صدا

این اختراع دستگاهی نوآورانه، کاربرپسند و وصله مانند است که از دو قسمت تشکیل شده: یک جزء حسگر مستقل است که سیگنال‌های حرکتی ماهیچه‌ها را به سیگنال‌های الکتریکی قابل تجزیه و تحلیل، با دقت بالا تشخیص داده و ترجمه می‌کند. سپس یک الگوریتم یادگیری ماشینی این داده‌های الکتریکی را به سیگنال‌های گفتاری ترجمه می‌کند. در نهایت این تکانه‌های گفتاری به صدای مورد نظر تبدیل می‌شوند.

به گفته محققان، هر جزء دارای دو لایه است: یک لایه القای مغناطیسی متشکل از سیم پیچ‌های القایی مس و یک لایه از ترکیب سیلیکونی زیست سازگار پلی دی متیل سیلوکسان یا «پی دی ام اس» (PDMS) با ویژگی‌های الاستیک. لایه پنجم که میدان مغناطیسی ایجاد می‌کند، بین دو جزء دیگر قرار گرفته و حاوی پلی دی متیل سیلوکسان همراه با ریزمغناطیس است.

این دستگاه با استفاده از ۲ جزء و ۵ لایه، حرکت ماهیچه‌ها را به سیگنال‌های الکتریکی تبدیل می‌کند. سپس توسط یک مدل یادگیری ماشین به سیگنال‌های گفتاری برای بیان شنیداری ترجمه می‌شود.

این گجت می‌تواند تغییرات میدان مغناطیسی ناشی از نیرو‌های مکانیکی، مانند حرکت عضلات حنجره را تشخیص دهد، زیرا از مکانیزم حسگر مغناطیسی الاستیک نرمی استفاده می‌کند که تیم چن در سال ۲۰۲۱ ایجاد کرد.

قابلیت استفاده این دستگاه به ابعاد آن کمک می‌کند که در هر طرف فقط ۱.۲ اینچ قطر و حدود ۷ گرم وزن دارد و تنها ۰.۰۶ اینچ ضخامت دارد. نوار دو طرفه زیست سازگار به راحتی روی گردن نزدیک آکورد‌های صوتی نصب می‌شود و می‌توان با استفاده مجدد از نوار در صورت لزوم دوباره از آن استفاده کرد.

راه حل‌های موجود مانند دستگاه‌های ویبراتور حنجره و روش‌های سوراخ کردن نای مری می‌توانند ناخوشایند، تهاجمی یا ناراحت کننده باشند. جون چن، سرپرست گروه تحقیقاتی بیوالکترونیک پوشیدنی در «یو سی ال ای»، گفت: این دستگاه جدید گزینه‌ای پوشیدنی و غیر تهاجمی را ارائه می‌دهد که می‌تواند به بیماران در برقراری ارتباط در طول دوره قبل از درمان و دوره بهبودی پس از درمان برای اختلالات صوتی کمک کند.

نقش یادگیری ماشینی چیست؟

هشت فرد سالم در آزمایشاتی شرکت کردند که در آن محققان دستگاه پوشیدنی را ارزیابی کردند. با جمع آوری داده‌ها در مورد حرکت حنجره، آنها توانستند کلمات خاصی را با سیگنال‌های تولید شده توسط یک الگوریتم یادگیری ماشینی مرتبط کنند. سپس از مؤلفه فعال سازی ابزار برای انتخاب سیگنال گفتار خروجی مناسب استفاده کردند.

از شرکت کنندگان خواسته شد که پنج جمله را بی صدا و با صدای بلند بگویند، از جمله «سلام راشل، امروز چطوری؟» و «دوستت دارم» تا درستی سیستم را نشان دهد.

فناوری پوشیدنی به گونه‌ای طراحی شده است که به اندازه کافی انعطاف پذیر باشد تا بتواند با آن حرکت کند و فعالیت ماهیچه‌های حنجره زیر پوست را ثبت کند.

محققان ادعا می‌کنند که مولفه تحریک سیگنال صوتی شرکت‌کنندگان را تقویت می‌کند، که نشان می‌دهد مکانیسم حسی سیگنال حرکت حنجره آنها را تشخیص داده و با جمله مربوطه که شرکت‌کنندگان می‌خواهند تلفظ کنند مطابقت دارد. این منجر به دقت پیش‌بینی کلی ۹۴.۶۸ درصد برای مدل شد.

در آینده، محققان قصد دارد این گجت را بر روی افراد دارای اختلالات گفتاری آزمایش کند و دایره لغات آن را از طریق یادگیری ماشینی گسترش دهند.