Pengertian, Definisi dan Fungsi Speech Recognition

Speech Recognition atau dalam bahasa Indonesia berarti pengenalan suara adalah kemampuan perangkat elektronik untuk memahami kata-kata yang diucapkan. Mikrofon merekam suara seseorang dan perangkat keras mengubah sinyal dari gelombang suara analog menjadi audio digital . Data audio kemudian diproses oleh perangkat lunak , yang menafsirkan suara sebagai kata-kata individual.

Jenis Speech Recognition yang umum adalah perangkat lunak "speech-to-text" atau "dikte", seperti Dragon Naturally Speaking, yang mengeluarkan teks saat Anda berbicara. Meskipun Anda dapat membeli program Speech Recognition, versi modern sistem operasi Macintosh dan Windows menyertakan fitur speech-to-text bawaan. Kemampuan ini memungkinkan Anda untuk merekam teks serta melakukan perintah sistem dasar.

Di Windows, beberapa program mendukung Speech Recognition secara otomatis sementara yang lain tidak. Anda dapat mengaktifkan Speech Recognition untuk semua aplikasi dengan memilih All Programs → Accessories → Ease of Access → Windows Speech Recognition dan mengklik "Enable dictation everywhere" Di OS X, Anda dapat mengaktifkan dikte di panel preferensi sistem "Dictation & Speech". Cukup centang tombol "Aktif" di sebelah Dikte untuk mengaktifkan kemampuan bicara-ke-teks. Untuk mulai mendikte dalam program yang didukung, pilih Edit → Start Dictation Anda juga dapat melihat dan mengedit perintah lisan di OS X dengan membuka panel preferensi sistem "Accessibility" dan memilih "Speakable Items".

Jenis Speech Recognition lainnya adalah ucapan interaktif, yang umum di perangkat seluler, seperti ponsel cerdas dan tablet . Perangkat iOS dan Android memungkinkan Anda berbicara ke telepon dan menerima respons verbal. Versi iOS disebut "Siri," dan berfungsi sebagai asisten pribadi. Anda dapat meminta Siri untuk menyimpan pengingat di ponsel Anda, memberi tahu ramalan cuaca, memberi Anda petunjuk arah, atau menjawab banyak pertanyaan lainnya. Jenis Speech Recognition ini dianggap sebagai antarmuka pengguna alami (atau NUI ), karena ia merespons masukan lisan Anda secara alami .

Sementara banyak sistem Speech Recognition hanya mendukung bahasa Inggris, beberapa perangkat lunak Speech Recognition mendukung banyak bahasa. Ini membutuhkan kamus unik untuk setiap bahasa dan algoritme tambahan untuk memahami dan memproses aksen yang berbeda. Beberapa sistem dikte, seperti Dragon Naturally Speaking, dapat dilatih untuk memahami suara Anda dan akan beradaptasi seiring waktu untuk memahami Anda dengan lebih akurat.

Lebih baru Lebih lama