تشخیص گفتار چیست؟

استفاده از صدای خود را به عنوان روش ورودی

تشخیص گفتار فن آوری است که امکان ورود به سیستم را به سیستم می دهد. شما با رایانه، تلفن یا دستگاه خود صحبت میکنید و از آنچه شما به عنوان ورودی گفته اید را برای استفاده از برخی اقدامات استفاده می کنید. این تکنولوژی برای جایگزینی روش های دیگر ورودی مانند تایپ کردن، کلیک کردن یا انتخاب روش های دیگر استفاده می شود. این وسیله برای ایجاد دستگاه و نرم افزار کاربر پسند و افزایش بهره وری است.

بسیاری از برنامه ها و زمینه هایی که در آن تشخیص گفتار استفاده می شود، از جمله ارتش، به عنوان کمک به افراد مبتلا به اختلال (تصور کنید یک فرد با فلج و یا بدون دست و یا انگشتان)، در زمینه پزشکی، در رباتیک و غیره وجود دارد. تقریبا همه به رسمیت شناختن گفتار در معرض انتشار آن در میان دستگاه های رایج مانند رایانه ها و تلفن های همراه قرار می گیرند.

برخی از تلفن های هوشمند استفاده جالب از تشخیص گفتار را انجام می دهند. دستگاه های آیفون و اندروید نمونه هایی از آن هستند. از طریق آنها، می توانید یک دستور تماس به یک مخاطب را با استفاده از دستورالعمل های گفتاری مانند «تماس با دفتر» آغاز کنید. دستورات دیگر نیز ممکن است سرگرم شوند، مانند «روشن کردن بلوتوث».

مشکلات تشخیص گفتار

به رسمیت شناختن گفتار، در نسخه خود به عنوان گفتار به متن (STT) شناخته شده است، نیز برای مدت زمان طولانی برای ترجمه کلمات گفتاری به متن استفاده می شود. "ViaVoice در جعبه خود می گوید:" شما صحبت می کنید، آن را تایپ کنید ". اما یک مشکل با STT وجود دارد که ما آن را می دانیم. بیش از 10 سال پیش، ViaVoice را امتحان کردم و هفته ای طولانی در کامپیوترم نگذاشتم. چرا؟ این به شدت نادرست بود و من تمام وقت و انرژی را صرف صحبت کردن و اصلاح نمودن کردم تا همه چیز را تایپ کنم. ViaVoice یکی از بهترین ها در صنعت است، بنابراین بقیه را تصور کنید. این تکنولوژی بالغ شده و بهبود یافته است، اما سخنرانی به متن هنوز باعث می شود مردم سؤال بپرسند. یکی از مشکلات اصلی آن، تنوع بسیار زیاد در میان مردم در تلفظ کلمات است.

همه زبان ها در تشخیص گفتار قرار نگرفته اند، و کسانی که انجام می دهند اغلب پشتیبانی نمی شود و همچنین انگلیسی. در نتیجه، اکثر دستگاه هایی که نرم افزار تشخیص گفتار را اجرا می کنند، تنها با زبان انگلیس قابل اجرا هستند.

مجموعه ای از نیازهای سخت افزاری، تشخیص گفتار را در موارد خاص به کار می گیرد. شما نیاز به یک میکروفون دارید که به اندازه کافی هوشمند است برای فیلتر کردن سر و صدای زمینه، اما در عین حال قدرتمند برای ضبط صوت به طور طبیعی.

صحبت از سر و صدای پس زمینه، می تواند کل سیستم را شکست دهد. به عنوان یک نتیجه، تشخیص گفتار در بسیاری موارد به علت صداهای خارج از کنترل کاربر ناکام می شود.

به رسمیت شناختن گفتار به عنوان یک روش ورودی برای تلفن های جدید و فن آوری های ارتباطی مانند VoIP، به عنوان یک ابزار بهره وری برای ورود متن توزیع، بهتر است.

برنامه های کاربردی تشخیص گفتار

این تکنولوژی در بسیاری از مناطق به محبوبیت می رسد و در موارد زیر موفقیت آمیز بوده است:

- کنترل دستگاه فقط می گویند "OK Google" به یک تلفن آندروید آتش سیستم تا به همه گوش به دستورات صوتی شما.

- سیستم های بلوتوث خودرو. بسیاری از اتومبیل ها با یک سیستم مجهز به مکانیزم رادیویی خود را به گوشی هوشمند خود از طریق بلوتوث متصل می کنند. پس از آن می توانید بدون دست زدن به گوشی های هوشمند خود تماس بگیرید و حتی می توانید با شماره گیری آنها را شماره گیری کنید.

- رونویسی صوتی در مناطقی که مردم مجبور به تایپ زیادی هستند، برخی از نرم افزارهای هوشمند، کلمات خود را ضبط کرده و آنها را به متن ارسال می کنند. این در برخی از نرم افزارهای پردازش کلمه فعلی است. رونویسی صوتی نیز با پست صوتی بصری کار می کند.