فناوری لبخوانی به یاری ناشنوایان میآید
13 اردیبهشت 1395 ساعت: 02:2
13 اردیبهشت 1395 ساعت: 02:2
فناوری لبخوانی علاوه بر آنکه میتواند به حل معماهای جنایی کمک کند، میتواند به یاری کسانی بیاید که دچار ناتوانیهای گفتاری و شنیداری هستند.
به نوشته هلثکر ایشیا تکنولوژی تشخیص بصری گفتار را دکتر هلن بئر و پروفسور ریچارد هاروی از دانشکده علوم رایانهای امارات متحده عربی خلق کردهاند، میتواند در هر مکانی که صداها به اندازه کافی رسا نیستند، برای فهمیدن حرفهای افراد استفاده شود.
دکتر بئر که یافتههایش را در کنفرانس بینالمللی آکوستیک، تکلم و پردازش سیگنال (ICASSP) در شانگهای ارائه شده است، میگوید عمدهترین مشکل تشخیص تکلم مربوط به زمانی است که صدا در اختیار نیست. این امر میتواند در دوربینهای مداربسته و زمانهایی اتفاق بیفتد که صدا ناکافی است و دسترسی به سرنخهایی که بتوان زمینه مکالمه را حدس زد، وجود ندارد.
اکنون فناوری طبقهبندی لبخوانی ماشینی، میتواند اصوات حرفهایی مانند p، b و m را که ظاهر مشابهی روی لبها دارند، از یکدیگر تمایز دهد و در نتیجه متن دقیقتری در اختیار بگذارد.
بئر در ادامه میگوید: «ما هنوز در حال فراگرفتن علم تکلم تصویری هستیم تا مدلی بازشناسی تمامعیار برای لبخوانی دست پیدا کنیم، با اینحال این سیستم طبقهبندی روشهای پیشین لبخوانی را با استفاده از یک روش آموزشی جدید برای طبقهبندیکنندهها (classifiers) (در هوش مصنوعی) بهبود میبخشد.»
اگرچه هنوز پیشرفتهایی باید در این زمینه انجام شود تا بتواند طیف وسیعی از کاربردها ازجمله کمک به ناتوانیهای شنوایی را در بربگیرد، یک ماشین لبخوانی خوب میتواند بخشی از یک سامانه تشخیصی صوتی-بصری باشد.
هاروی میگوید: «لبخوانی یکی از چالشبرانگیزترین مسائل در هوش مصنوعی است، بنابراین پیشرفت در یکی از جنبههای پیچیدهتر آن یعنی چگونگی تعلیم دادن ماشین برای بازشناسی ظاهر و شکل لبهای انسان فوقالعاده است.»
دکتر بئر که یافتههایش را در کنفرانس بینالمللی آکوستیک، تکلم و پردازش سیگنال (ICASSP) در شانگهای ارائه شده است، میگوید عمدهترین مشکل تشخیص تکلم مربوط به زمانی است که صدا در اختیار نیست. این امر میتواند در دوربینهای مداربسته و زمانهایی اتفاق بیفتد که صدا ناکافی است و دسترسی به سرنخهایی که بتوان زمینه مکالمه را حدس زد، وجود ندارد.
اکنون فناوری طبقهبندی لبخوانی ماشینی، میتواند اصوات حرفهایی مانند p، b و m را که ظاهر مشابهی روی لبها دارند، از یکدیگر تمایز دهد و در نتیجه متن دقیقتری در اختیار بگذارد.
بئر در ادامه میگوید: «ما هنوز در حال فراگرفتن علم تکلم تصویری هستیم تا مدلی بازشناسی تمامعیار برای لبخوانی دست پیدا کنیم، با اینحال این سیستم طبقهبندی روشهای پیشین لبخوانی را با استفاده از یک روش آموزشی جدید برای طبقهبندیکنندهها (classifiers) (در هوش مصنوعی) بهبود میبخشد.»
اگرچه هنوز پیشرفتهایی باید در این زمینه انجام شود تا بتواند طیف وسیعی از کاربردها ازجمله کمک به ناتوانیهای شنوایی را در بربگیرد، یک ماشین لبخوانی خوب میتواند بخشی از یک سامانه تشخیصی صوتی-بصری باشد.
هاروی میگوید: «لبخوانی یکی از چالشبرانگیزترین مسائل در هوش مصنوعی است، بنابراین پیشرفت در یکی از جنبههای پیچیدهتر آن یعنی چگونگی تعلیم دادن ماشین برای بازشناسی ظاهر و شکل لبهای انسان فوقالعاده است.»
برچسب ها
دیدگاه کاربران
ممکن است این مطالب هم برای شما مفید باشد