Pengertian
Pengenalan ucapan atau pengenalan wicara, dalam
istilah bahasa Inggrisnya Automatic Speech Recognition (ASR) adalah suatu
pengembangan teknik dan sistem yang memungkinkan komputer untuk menerima
masukan berupa kata yang diucapkan. Teknologi ini memungkinkan suatu perangkat
untuk mengenali dan memahami kata-kata yang diucapkan dengan cara digitalisasi
kata dan mencocokkan sinyal digital tersebut dengan suatu pola tertentu yang
tersimpan dalam suatu perangkat.
Sejarah singkat
Speech recognition atau pengenalan ucapan
ditemukan pada tahun 1952 oleh Bell Laboratories. Mereka menamainya Audrey,
sebuah sistem speech recognition yang difokuskan pada angka, bukan kata-kata. Lalu
10 tahun setelahnya, IBM mengeluarkan speech recognition yang diberinama
Shoebox, yang memahami dan dapat merespon 16 kata dalam bahasa inggris. HIngga
akhirnya berbagai ilmuwan di seluruh dunia berusaha keras untuk mengembangkan
perangkat speech recognition yang dapat mengenali suara dan ucapan dengan lebih
baik dan akurat.
Jenis-Jenis pengenalan speech recognition
- Kata-kata yang terisolasi
Proses pengidentifikasian kata yang hanya dapat mengenal kata yang diucapkan jika kata tersebut memiliki jeda waktu pengucapan antar kata - Kata-kata yang berhubungan
Proses pengidentifikasian kata yang mirip dengan kata-kata terisolasi, namun membutuhkan jeda waktu pengucapan antar kata yang lebih singkat - Kata-kata yang berkelanjutan
Proses pengidentifikasian kata yang sudah lebih maju karena dapat mengenal kata-kata yang diucapkan secara berkesinambungan dengan jeda waktu yang sangat sedikit atau tanpa jeda waktu. Proses pengenalan suara ini sangat rumit karena membutuhkan metode khusus untuk membedakan kata-kata yang diucapkan tanpa jeda waktu. Pengguna perangkat ini dapat mengucapkan kata-kata secara natural - Kata-kata spontan
Proses pengidentifikasian kata yang dapat mengenal kata-kata yang diucapkan secara spontan tanpa jeda waktu antar kata - Verifikasi atau identifikasi suara
Proses pengidentifikasian kata yang tidak hanya mampu mengenal kata, namun juga mengidentifikasi siapa yang berbicara.
Kelebihan dan kekurangan speech recognition
Cepat
dan Mudah digunakan
Rawan
terhadap gangguan dan Jumlah kata yang dapat dikenal terbatas
Perbedaan voice recognition dan speech recognition
speech recognition dapat mengerti kata apa yang dikatakan oleh seseorang sedangkan voice recognition dapat mengidentifikasi seseorang melalui suaranya.
Contoh penggunaan speech recognition pada Pokemon Home