Tuesday, July 5, 2022

Speech Recognition

Pengertian 

Pengenalan ucapan atau pengenalan wicara, dalam istilah bahasa Inggrisnya Automatic Speech Recognition (ASR) adalah suatu pengembangan teknik dan sistem yang memungkinkan komputer untuk menerima masukan berupa kata yang diucapkan. Teknologi ini memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital tersebut dengan suatu pola tertentu yang tersimpan dalam suatu perangkat.


Sejarah singkat 

Speech recognition atau pengenalan ucapan ditemukan pada tahun 1952 oleh Bell Laboratories. Mereka menamainya Audrey, sebuah sistem speech recognition yang difokuskan pada angka, bukan kata-kata. Lalu 10 tahun setelahnya, IBM mengeluarkan speech recognition yang diberinama Shoebox, yang memahami dan dapat merespon 16 kata dalam bahasa inggris. HIngga akhirnya berbagai ilmuwan di seluruh dunia berusaha keras untuk mengembangkan perangkat speech recognition yang dapat mengenali suara dan ucapan dengan lebih baik dan akurat.


Jenis-Jenis pengenalan speech recognition

  1. Kata-kata yang terisolasi
    Proses pengidentifikasian kata yang hanya dapat mengenal kata yang diucapkan jika kata tersebut memiliki jeda waktu pengucapan antar kata
  2. Kata-kata yang berhubungan
    Proses pengidentifikasian kata yang mirip dengan kata-kata terisolasi, namun membutuhkan jeda waktu pengucapan antar kata yang lebih singkat
  3. Kata-kata yang berkelanjutan
    Proses pengidentifikasian kata yang sudah lebih maju karena dapat mengenal kata-kata yang diucapkan secara berkesinambungan dengan jeda waktu yang sangat sedikit atau tanpa jeda waktu. Proses pengenalan suara ini sangat rumit karena membutuhkan metode khusus untuk membedakan kata-kata yang diucapkan tanpa jeda waktu. Pengguna perangkat ini dapat mengucapkan kata-kata secara natural
  4. Kata-kata spontan
    Proses pengidentifikasian kata yang dapat mengenal kata-kata yang diucapkan secara spontan tanpa jeda waktu antar kata
  5. Verifikasi atau identifikasi suara
    Proses pengidentifikasian kata yang tidak hanya mampu mengenal kata, namun juga mengidentifikasi siapa yang berbicara.

Kelebihan dan kekurangan  speech recognition

Cepat dan Mudah digunakan

Rawan terhadap gangguan dan Jumlah kata yang dapat dikenal terbatas


Perbedaan voice recognition dan speech recognition

speech recognition dapat mengerti kata apa yang dikatakan oleh seseorang sedangkan voice recognition dapat mengidentifikasi seseorang melalui suaranya.


Contoh penggunaan speech recognition pada Pokemon Home