Bagaimana Menerapkan Pengenalan Karakter Optik dengan Python



Artikel ini akan memberi Anda pengetahuan terperinci dan komprehensif tentang cara menerapkan Pengenalan Karakter Optik dengan Python.

Pengenalan Karakter Optik sangat penting dan merupakan aspek kunci dan bahasa pemrograman. Penerapan konsep semacam itu dalam skenario dunia nyata sangat banyak. Pada artikel ini, kita akan membahas bagaimana menerapkan Pengenalan Karakter Optik dengan Python

Aplikasi Pengenalan Karakter Optik

Konter tiket menggunakan ini secara ekstensif untuk memindai dan mendeteksi informasi penting pada tiket untuk melacak detail rute dan komuter. Konversi teks kertas ke dalam format digital di mana kamera menangkap foto resolusi tinggi dan kemudian OCR digunakan untuk mengubahnya menjadi format kata atau PDF.





java kapan harus menggunakan ini

charachters

Pengenalan OCR dengan python dikreditkan ke penambahan pustaka serbaguna seperti 'Tesseract' dan 'Orcad'. Perpustakaan ini telah membantu banyak pembuat kode dan pengembang untuk menyederhanakan desain kode merekadan memungkinkan mereka untuk menghabiskan lebih banyak waktu pada aspek lain dari proyek mereka. Karena manfaatnya sangat besar, mari kita intip apa itu dan bagaimana cara melakukannya.



Membangun Pengenalan Karakter Optik dengan Python

Pertama-tama kita perlu membuat kelas menggunakan 'pytesseract'. Kelas ini akan memungkinkan kita untuk mengimpor gambar dan memindainya. Dalam prosesnya, ini akan mengeluarkan file dengan ekstensi 'ocr.py'. Mari kita lihat kode di bawah ini. Blok fungsi 'process_image' digunakan untuk mempertajam teks yang kita dapatkan.

Penangan rute dan fungsi tampilan berikut ditambahkan ke aplikasi (app.py).

Kode Penangan Router



// ROUTE HANDLER @ app.route ('/ v {} / ocr'.format (_VERSION), metode = [' POST ']) def ocr (): coba: url = request.json [' image_url '] if' jpg 'in url: output = process_image (url) return jsonify ({' output ': output}) else: return jsonify ({' error ':' only .jpg files, please '}) kecuali: return jsonify ({' error ':' Apakah maksud Anda mengirim: {'image_url': 'some_jpeg_url'} '})

Kode Mesin OCR

// OCR ENGINE mengimpor permintaan impor pytesseract dari PIL impor Gambar dari PIL impor ImageFilter dari StringIO impor StringIO def process_image (url): image = _get_image (url) image.filter (ImageFilter.SHARPEN) return pytesseract.image_to_string (image) def _get_image ( url): return Image.open (StringIO (requests.get (url) .content)) //

Harap pastikan untuk memperbarui impor dan menambahkan nomor versi API.

impor os import logging dari logging import Formatter, FileHandler dari flask import Flask, request, jsonify dari ocr import process_image _VERSION = 1 # versi API

Kami menambahkan respons JSON dari fungsi OCR Engine yaitu 'process_image ()'. JSON digunakan untuk mengumpulkan informasi masuk dan keluar dari API. Kami meneruskan respons dalam file objek menggunakan pustaka 'Gambar' dari PIL untuk menginstalnya.

Harap dicatat bahwa kode ini hanya bekerja paling baik dengan gambar .jpg saja. Jika kita menggunakan perpustakaan kompleks yang dapat menampilkan berbagai format gambar, maka semua gambar dapat diproses secara efektif. Perhatikan juga, jika anda tertarik untuk mencoba kode ini sendiri, maka silahkan install PIL yang didapat dari library “Pillow” terlebih dahulu

& bull Mulailah dengan menjalankan aplikasi, yaitu “app.py”:

// $ cd ../home/flask_server/ $ python app.py //

& bull Kemudian, di terminal lain, jalankan:

// $ curl -X POST http: // localhost: 5000 / v1 / ocr -d '{' image_url ':' some_url '}' -H 'Content-Type: application / json'

Sebagai contoh:

// $ curl -X POST http: // localhost: 5000 / v1 / ocr -d '{' C: UsersakashDownloadsPic1 ':' https://edureka.com/images/blog_images/ocr/ocr.jpg '}' - H 'Content-Type: application / json' {'output': 'ABCDEnFGH I JnKLMNOnPQRST'} //

Keuntungan dan Kerugian Mesin OCR

Dari sekian banyak aplikasi yang menggunakan OCR dengan python, yang paling populer adalah pengenalan tulisan tangan. Orang menerapkan ini untuk membuat ulang teks tertulis yang kemudian dapat diisi menjadi banyak salinan daripada hanya memfotokopi naskah asli. Ini untuk mewujudkan keseragaman dan keterbacaan.

OCR juga berguna dalam mengonversi PDF menjadi teks dan menyimpannya sebagai variabel. Ini kemudian dapat dikenakan sejumlah pra-pemrosesan untuk tugas tambahan. Meskipun konsep OCR tampaknya menjadi topik yang bermanfaat di dunia Python, konsep ini memiliki kelemahan yang sama.

OCR tidak selalu dapat menjamin akurasi 100%. Banyak jam pelatihan perlu diterapkan dengan bantuan konsep Kecerdasan Buatan yang memungkinkan mesin OCR untuk mempelajari dan mengenali gambar yang buruk. Gambar tulisan tangan dapat dikenali tetapi tergantung pada beberapa faktor seperti gaya tulisan, warna halaman, kontras gambar dan resolusi gambar.

Dengan ini, kita sampai pada akhir artikel Pengenalan Karakter Optik dengan Python ini. Saya harap Anda memahami bagaimana tepatnya OCR bekerja.

Untuk mendapatkan pengetahuan mendalam tentang Python beserta berbagai aplikasinya, Anda bisa untuk pelatihan online langsung dengan dukungan 24/7 dan akses seumur hidup.

untuk apa pemrograman sas digunakan

Ada pertanyaan untuk kami? Sebutkan mereka di bagian komentar 'Pengenalan Karakter Optik dengan Python' dan kami akan menghubungi Anda kembali.