Monday, November 28, 2011

Merubah Hasil Scanner menjadi bentuk text

Mendapat pekerjaan untuk mengetik Buku, Laporan atau dokumen lainnya? Selesaikan lebih cepat dengan menggunakan OCR. 


OCR (Optical Character Recognition) merupakan sebuah teknologi yang dapat membaca dan mengenali teks dari suatu gambar. Gambar yang dimaksud biasanya berupa hasil scan yang mengandung teks, tentunya teks di dalamnya tidak bisa di olah atau di edit karena masih berupa format gambar. Dengan OCR, teks dalam gambar tersebut dapat di ubah menjadi teks yang bisa di olah kembali.

Dengan OCR, pekerjaan mengetik dokumen dapat benar-benar di mudahkan. Cukup scan dokumen yang tadinya mau di ketik lalu buka hasil scan dengan software OCR. Dan teks di dalamnya langsung dapat digunakan, entah untuk di edit atau di olah kembali tanpa harus mengetik dari awal sampai akhir.
Salah satu software OCR yang lumayan bagus adalah Simple OCR, software inilah yang digunakan dalam artikel Komputok kali ini. Meskipun keakuratan pengenalan karakternya bukan yang terbaik, namun fasilitas editing yang disediakan olehnya sangat membantu untuk mengoreksi kata-kata yang salah secara manual.
Selain itu, Simple OCR juga dilengkapi dengan kamus kata, dia akan menebak kata yang agak sulit di baca dengan kata yang paling mendekati di kamusnya. Namun, hanya efektif untuk tulisan yang berbahasa inggris, karena isi kamusnya masih berbahasa inggris.
Langsung saja, langkah demi langkah cara menggunakan Simple OCR
  1. Download software Simple OCR di http://www.simpleocr.com/Download.asp dengan ukuran sekitar 9 MB, lalu instal seperti biasa.

  2. Setelah selesai di instal, jalankan simple OCR. Akan muncul pilihan, apakah mau Machine Print, yaitu hasil ketikan komputer atau hand writing, yakni tulisan tangan. Hand writing apabila ingin mengubah tulisan tangan menjadi teks di komputer, namun penggunaannya dibatasi 14 hari saja, selebihnya bayar. Karena yang akan kita gunakan kali ini adalah teks hasil ketikan komputer, maka klik Machine Print.
  3. Di jendela selanjutnya, pilih [Select]. Setelah itu, jendela utama Simple OCR akan muncul. Untuk memulai, klik [add page] Akan terdapat beberapa pilihan, apakah mau langsung dari scanner, file, Batch(untuk halaman dalam jumlah banyak sekaligus), atau membuka file dengan format inklink. Pilih sesuai kebutuhan, namun dalam tutorial kali ini, yang dipilih adalah [file], dengan asumsi, file yang akan di akan di baca sudah ada sebelumnya, lalu klik ok.


  4. Buka file gambar yang akan di baca. Sebelumnya, pastikan file yang akan di baca memiliki teks yang mudah di baca dan memiliki resolusi tinggi, semakin tinggi, maka semakin mudah simple OCR mengenali teks di dalamnya. Rata-rata resolusi hasil scan scanner sudah mencukupi untuk dilakukan pembacaan.


  5. Setelah di pilih, maka akan di tampilkan preview gambarnya, bila sudah yakin gambar tersebut yang mau di baca , klik [continue].



  6. Selanjutnya, lakukan editing gambar yang akan di baca. Untuk memisahkan teks dengan gambar, gunakan icon picture region  untuk menyeleksi gambarnya , mengabaikan area tertentu agar sofware tidak membacanya, gunakan ignore region {icon_1.bmp} atau menghapus area tertentu, gunakan delete region { Ketiga tool tersebut ada di toolbar Simple OCR. Setelah yakin semua sudah di edit dengan baik, klik [convert to text]. Simple OCR akan membaca dan mengenali semua teks dalam gambar dan menampilkan teks hasil pembacaannya.


  7. Dalam proses pembacaan, Simple OCR mungkin akan salah membaca beberapa teks. Dapat disebabkan karena memang teks tersebut agak sulit terbaca atau resolusinya kurang baik. Karena itu, tugas terakhir kita adalah mengoreksinya. Editornya langsung dari simple OCR, sederhana, efektif dan mudah digunakan.


  8. Warna huruf menandakan tingkat akurasi kata yang di koreksi, warna hitam artinya kata sudah akurat. Biru, artinya mendekati akurat dan warna merah artinya perlu di koreksi lagi. Gunakan tombol enter untuk berpindah dari kata ke kata lainnya, dan bandingkan kata yang sedang di edit dengan kata yang masih dalam format gambar di atasnya.
  9. Apabila semua kata sudah di koreksi, save teks hasil pembacaan tadi di format doc atau txt. 
Proses ini hanya membutuhkan waktu sebentar, tergantung dari banyaknya revisi yang harus dilakukan, tentunya jauh lebih singkat bila dibandingkan mengetik sendiri secara manual. Pekerjaan mengetik dapat di hindari untuk bisa mengerjakan pekerjaan lain yang lebih penting. 

Alternatif lain, jika ingin menghemat waktu, MS Office OneNote 2007 juga menyediakan fasilitas OCR. Cara pakainya tinggal buka file gambarnya di OneNote, klik kanan, lalu pilih “copy text from picture”, lalu paste di teks editor seperti Word, atau notepad. Hanya saja, fasilitas yang disediakan tidak sebanyak softwae OCR lainnya.

Selamat Mencoba....

No comments:

Post a Comment