Pengecaman aksara optik
Pengecaman aksara optik[1][2] (bahasa Inggeris: optical character recognition , OCR) ialah penukaran elektronik atau mekanikal imej teks wakilan suatu aksara yang ditaip, ditulis tangan atau dicetak atas kertas kepada teks terkod mesin diselarikan,[1] sama ada dari dokumen terimbas, foto dokumen mahupun pemandangan (contohnya teks pada papan tanda dan papan iklan dalam foto landskap) atau dari teks sari kata tertindih pada suatu imej (contohnya: dari siaran televisyen)[3] dalam suatu alat khusus (pembaca aksara optik, optical character reader[4]).
Kaedah ini umum dalam pendigitan teks tercetak agar ia boleh disunting secara elektronik, dicari, disimpan dengan lebih padat, dipapar pada baris, dan digunakan dalam proses mesin seperti pengkomputan kognitif, terjemahan mesin, teks-ke-tutur (tersari), data utama dan perlombongan teks. Ia luas digunakan sebagai bentuk kemasukan data dari rekod data kertas tercetak terutamanya dalam penghantaran maklumat peribadi mahupun kewangan[2] – sama ada dokumen pasport, invois, penyata bank, resit berkomputer, kad perniagaan, surat, cetakan data statik, atau mana-mana pendokumenan yang sesuai. Teknologi ini tercakup penyelidikan dalam bidang-bidang pengecaman corak, kecerdasan buatan dan penglihatan komputer.
Versi awal perlu dilatih dengan imej setiap aksara, dan berfungsi pada satu fon pada satu masa. Sistem lanjutan berupaya menghasilkan darjah tinggi kejituan pengecaman bagi kebanyakan fon yang kini umum, dan dengan sokongan untuk pelbagai input format fail imej digital.[5] Beberapa sistem berupaya menerbit semula output terformat yang hampir dekat dengan halaman asal termasuk imej, lajur, dan komponen bukan teks yang lain.
Lihat juga
[sunting | sunting sumber]- Kesan AI
- Penggunaan kecerdasan buatan
- Perbandingan perisian pengecaman aksara optik
- Linguistik pengiraan
- Perpustakaan digital
- Bilik mel digital
- Pen digital
- Repositori institusi
- Mudah baca
- Senarai teknologi memuncul
- Penyelesaian pengecaman aksara dakwat langsung
- Pengecaman aksara dakwat magnet
- OCR muzik
- OCR dalam bahasa-bahasa India
- Pengecaman tanda optik
- Kerangka kecerdasan buatan
- Pengecaman lakaran
- Pengecaman pertuturan
- Enjin OCR Tesseract
- Perakaman suara
Rujukan
[sunting | sunting sumber]- ^ a b Rao dkk., "pengecaman aksara optik", m/s. 56
- ^ a b Muhammad Mun'im Ahmad Zabidi (1996). Asas Organisasi Sistem Komputer. Skudai, Johor: Penerbit Universiti Teknologi Malaysia. m/s. 110–111. ISBN 983-52-0057-2.
- ^ OnDemand, HPE Haven. "OCR Document". Diarkibkan daripada yang asal pada 15 April 2016.
- ^ Rao dkk., "pembaca aksara optik", m/s. 48
- ^ OnDemand, HPE Haven. "undefined". Diarkibkan daripada yang asal pada 19 April 2016.
- Sumber utama
- G. S. Rao, A. K. Rao, Ng Chee Aun & Cheng Yok San (1991). Kamus Komputer Sekolah Menengah. Penerbit Fajar Bakti Sdn Bhd. ISBN 967-65-1306-7.CS1 maint: uses authors parameter (link)
Pautan luar
[sunting | sunting sumber]Wikimedia Commons mempunyai media berkaitan Pengecaman aksara optik |
- Unicode OCR – Hex Range: 2440-245F Pengecaman Aksara Optik dalam Unicode (dalam bahasa Inggeris)
- Bibliografi anotasi rujukan untuk pengenalan karakter tulisan tangan dan pengkomputeran pen (dalam bahasa Inggeris)