یک پیشرفت علمی در خواندن ذهن: اختراع ابزارهایی که همه می توانند بخرند
یک پیشرفت علمی در خواندن ذهن: اختراع ابزارهایی که همه می توانند بخرند

تصویری: یک پیشرفت علمی در خواندن ذهن: اختراع ابزارهایی که همه می توانند بخرند

تصویری: یک پیشرفت علمی در خواندن ذهن: اختراع ابزارهایی که همه می توانند بخرند
تصویری: این پسر پس از 12 سال از کما بیرون آمد و چیزهایی که گفت همه را شگفت زده کرد 2024, ممکن است
Anonim

مهندسان مؤسسه مطالعه فعالیت های عصبی عالی توانسته اند سیستمی ایجاد کنند که افکار را به گفتار قابل فهم و قابل تشخیص تبدیل می کند. فناوری با کنترل فعالیت مغز افراد، افکار را به کلمات بازسازی می کند.

این پیشرفت علمی، همراه با قدرت هوش مصنوعی و سینت سایزرهای گفتار، عصر جدیدی را در تعامل بین رایانه و مغز می گشاید. البته، این همچنین فرصت های جدیدی را برای افرادی که به دلایلی توانایی صحبت کردن را از دست داده اند، باز می کند.

صدای ما به حفظ ارتباط با دوستان، خانواده و دنیای اطرافمان کمک می کند، بنابراین از دست دادن قدرت صدا به دلیل آسیب یا بیماری برای مردم ویرانگر است. با این حال، با دانش امروزی، ما یک راه بالقوه برای بازیابی این قدرت داریم. نیما مسگرانی، دکترای تخصصی و یکی از نویسندگان مطالعه‌ای که در موسسه رفتار ذهنی مورتیمر ب. زاکرمن در کلمبیا انجام شده است، می‌گوید: ما نشان داده‌ایم که با فناوری مناسب، افکار افراد برای هر شنونده قابل رمزگشایی و درک است. دانشگاه.

دهه‌ها تحقیق نشان داده است که وقتی افراد صحبت می‌کنند یا حتی تصور می‌کنند که در حال بیان کلمات هستند، الگوهای مشخصی از فعالیت در مغز آنها ظاهر می‌شود. یک الگوی سیگنال دهی واضح و قابل تشخیص نیز زمانی ایجاد می شود که به صحبت شخصی گوش می دهیم، یا تصور می کنیم که داریم گوش می دهیم. متخصصان دهه‌ها تلاش کرده‌اند که این الگوها را رمزگشایی کنند، اما اکنون آینده‌ای در برابر آن‌ها گشوده شده است که در آن نمی‌توان افکار را دیگر در مغز پنهان کرد، بلکه می‌توان آن را به دلخواه به زبان گفتاری ترجمه کرد.

اما انجام این شاهکار آسان نبود. تلاش‌های اولیه برای رمزگشایی سیگنال‌های مغزی دکتر مسگرانی و دیگران بر مدل‌های کامپیوتری ساده‌ای متمرکز بود که طیف‌نگارها را که نمایش‌های بصری فرکانس‌های صدا هستند، تجزیه و تحلیل می‌کردند.

اما با توجه به این واقعیت که این رویکرد چیزی نزدیک به گفتار قابل فهم تولید نمی کند، تیم دکتر مسگرانی در عوض به یک Vocoder، یک الگوریتم کامپیوتری که می تواند گفتار را پس از آموزش برای ضبط مکالمات افراد، ترکیب کند، روی آوردند.

دکتر مسگرانی که همچنین دانشیار مهندسی برق در دانشکده مهندسی و علوم کاربردی کلمبیا بنیاد فو است، گفت: «این همان فناوری است که Amazon Echo و Apple Siri برای پاسخ شفاهی به سؤالات ما استفاده می‌کنند».

دکتر مسگرانی برای آموزش رمزگذار صدا برای تفسیر فعالیت مغز، با اشش دینش مهتا، دکترا، جراح مغز و اعصاب در موسسه علوم اعصاب شرکای سلامت Northwell Health و یکی از نویسندگان مقاله امروز همکاری کرد. دکتر مهتا بیماران مبتلا به صرع را درمان می کند که برخی از آنها باید به طور منظم تحت عمل جراحی قرار گیرند.

دکتر مسگرانی می‌گوید: «در کار با دکتر مهتا، از بیماران صرعی که قبلاً جراحی مغز انجام داده‌اند، خواستیم تا به پیشنهادات افراد مختلف گوش دهند و الگوهای فعالیت مغز آنها را اندازه‌گیری کنیم.» "این الگوهای عصبی، رمزگذار صدا را آموزش دادند."

سپس محققان از همان بیماران خواستند به بلندگوهایی گوش دهند که اعداد 0 تا 9 را تلفظ می‌کنند و در عین حال سیگنال‌های مغزی را ضبط می‌کنند که می‌توان آن را از طریق یک کد صوتی ارسال کرد. صدای تولید شده توسط Vocoder در پاسخ به این سیگنال ها با استفاده از شبکه های عصبی مانند هوش مصنوعی که ساختار نورون ها را در یک مغز بیولوژیکی تقلید می کند، تجزیه و تحلیل و پالایش شد.

نتیجه نهایی صدای رباتیکی بود که دنباله ای از اعداد را تکرار می کرد.برای بررسی صحت ضبط، دکتر مسگرانی و تیمش به مردم دستور دادند که به ضبط گوش داده و آنچه را که شنیده اند گزارش دهند.

دکتر مسگرانی می‌گوید: «ما دریافتیم که انسان‌ها می‌توانند 75 درصد مواقع صداها را بفهمند و تکرار کنند، که بسیار برتر از هر تلاش قبلی است. بهبود درک به ویژه هنگام مقایسه ضبط‌های جدید با تلاش‌های قبلی بر اساس طیف‌نگار مشهود بود. یک صداگذار حساس و شبکه های عصبی قدرتمند صداهایی را که بیماران در ابتدا با دقت شگفت انگیزی می شنیدند را نشان می داد.

دکتر مسگرانی و تیمش اکنون قصد دارند کلمات و جملات دشوارتری را آزمایش کنند. آنها همچنین قصد دارند آزمایش‌های مشابهی را روی سیگنال‌های مغزی که هنگام صحبت کردن یا تصور صحبت کردن فرد منتشر می‌شوند، انجام دهند. در نهایت، آنها امیدوارند که سیستم آنها بتواند بخشی از ایمپلنت باشد، شبیه به ایمپلنت هایی که توسط برخی از بیماران صرعی استفاده می شود، که افکار استفاده کننده را مستقیماً به کلمات ترجمه می کند.

دکتر مسگرانی می‌گوید: «در این سناریو، اگر صاحب تراشه فکر کند، «من به یک لیوان آب نیاز دارم»، سیستم ما می‌تواند سیگنال‌های مغزی تولید شده توسط آن فکر را دریافت کرده و آنها را به گفتار کلامی ترکیبی تبدیل کند. این یک تغییر دهنده بازی است و برای هر کسی که به دلیل آسیب یا بیماری توانایی صحبت کردن را از دست داده است، فناوری فرصت جدیدی برای برقراری ارتباط با دنیای اطراف خود می دهد.

نظر تحریریه The Big The One: از آنجایی که برخی از کارمندان ما رابطه خاصی با فیزیولوژی عصبی دارند، می‌توانیم به صراحت بگوییم که حل مشکل خواندن افکار و ترجمه این افکار به کلمات مشکلی نیست که یک دکتر فلسفه بتواند همراه با یک جراح مغز و اعصاب باهوش حل کند. این وظیفه پژوهشگاه است که صد، دویست سال یا بیشتر آن را حل خواهد کرد. علاوه بر این، به هیچ وجه این واقعیت نیست که موسسه تحقیقاتی این مشکل را حل خواهد کرد - حتی اگر تمام ابر رایانه های ناسا به آنجا آورده شوند، که در آن جمعی از مهندسان شروع به شبیه سازی شبکه های عصبی خواهند کرد. با این حال، مقاله در یک مجله علمی دروغ نخواهد گفت و حقیقت شناخت افکار قطعا وجود دارد. پس چگونه می توان این دو واقعیت را با هم جمع کرد؟

بسیار ساده. در 20-30 سال گذشته، تعداد زیادی فناوری کاملاً باورنکردنی و بسیار پیچیده مانند ریزپردازنده ها و هارد دیسک ها در جهان ظاهر شده اند. و هر روز اختراعات جدید بیشتری ظاهر می شود که برای برخی از "دانشجویان با استعداد" که در گاراژ نشسته اند، قطعه ای از آهن قراضه را جمع آوری کرده اند، که موسسات تحقیقاتی 50 سال بر سر آن دست و پنجه نرم می کنند، ثبت می شود. و در این مورد ما اختراعی از یک پیدایش مشابه داریم. یعنی توسعه ای که سال ها توسط یک فرد ناشناس انجام شده (یا به مردم منتقل شده است) اما برای عمه و عمویی از کلمبیا نوشته شده است.

در واقع، مطلقاً هیچ تفاوتی وجود ندارد که ویکی‌پدیا چه کسی را به‌عنوان «مخترع» فناوری یادداشت کند. نکته اصلی این است که این فناوری با استفاده از یک مجله علمی به جهان ارائه شد. علاوه بر این، برخی از شرکت های چینی شروع به تولید چنین "گجت هایی" خواهند کرد که مردم را به این ایده عادت می دهند که اکنون سر آنها کاملاً شفاف شده است. در نهایت مرحله سوم همان «۱۹۸۴» اورولی خواهد بود که حتی افکار هر شخصی را می توان آزادانه از راه دور خواند. به عنوان مثال، با قرار دادن حسگرهای ویژه در آپارتمان ها یا ادغام یک تراشه ویژه که به تکانه های مغزی در بدن پاسخ می دهد. علاوه بر این.

به عنوان یک قاعده، هر فناوری کاربرد معکوس دارد. به عنوان مثال، اگر فناوری تبدیل تکانه های عصبی به کلمات وجود دارد، با استفاده از همان اصل، می توانید هر کلمه ای را به افکار دیگران تبدیل کنید. در این شرایط، روسای جمهور کشورهای مختلف چشم انداز بزرگی برای حمایت مطلق رای دهندگان دارند، زیرا اکنون یک فرصت فنی وجود دارد که هر رای دهنده ای حتی مانند او فکر کند - کافی است یک سیگنال مدوله شده به درستی در سوکت قرار دهید..

به طور کلی، چه باید گفت - چشم اندازهای جهان در حال باز شدن شگفت انگیزترین هستند و ما با علاقه توسعه رویدادها را دنبال می کنیم.

توصیه شده: