Sắp xếp dữ liệu

Thư mục

Bài ảnh

Kỷ niệm 2010

7988765 Tập huấn Công nghệ thông tin Phòng GD-ĐT Lục Nam - Bắc Giang Ngày 11 - 12 / 9 / 2010 thầy - quản trị thầy Thầy Lương Hùng giới thiệu trang web: 2 ngày tập huấn tại Lục Nam, Bắc Giang để lại cho chúng tôi rất nhiều kỷ niệm đáng nhớ! Dù thời tiết...
Xem tiếp

My Clip

TẬP HUẤN VIOLET QUẢNG NINH 8/2017
DU LỊCH CÔ TÔ 14/6/2016
HƯỚNG DẪN ĐO MAY BỘ ĐỒ VEST NAM

Chào mừng quý vị đến với Do Manh Ha 's Website.

Quý vị chưa đăng nhập hoặc chưa đăng ký làm thành viên, vì vậy chưa thể tải được các tư liệu của Thư viện về máy tính của mình.
Nếu đã đăng ký rồi, quý vị có thể đăng nhập ở ngay ô bên phải.
Gốc > Bài viết >

Hướng dẫn lấy chữ (text) từ ảnh - OCR

Khi soạn thảo bài giảng điện tử, việc chép lại chữ trong các sách tham khảo, sách giáo khoa, sách nâng cao,... để đưa vào bài giảng, bài tập khiến các thầy cô giáo mất khá nhiều thời gian. Việc scan hoặc chụp ảnh lại trang sách để lấy chữ ra từ đó giúp cho các thầy cô thoát khỏi công việc gõ văn bản và tiết kiệm được rất nhiều thời gian!

OCR là gì ?

1. Khái niệm
Thuật ngữ OCR : Optical Character Recognition 
Dịch qua Tiếng Việt gọi là: Nhận dạng ký tự bằng quang học.
Đây là công nghệ được áp dụng để nhận dạng ký tự trên một định dạng file hình và chuyển nó thành định dạng file text.

2. Phạm vi ứng dụng
OCR thường được ứng dụng như một phần mềm cài đặt trên máy tính (ABBYY, FreeOCR, LimeOCR, Softi FreeOCR, SmartOCR, Boxoft FreeOCR, VnDOCR,...) hoặc tích hợp đi kèm với phần cứng (cụ thể là máy Scanner: OmniPage) hoặc được thiết lập như một ứng dụng trực tuyến.

Ví dụ:
- ABBYY FineReader là một phần mềm ứng dụng công nghệ OCR nổi tiếng nhất hiện nay.

- Website http://www.free-ocr.com/ là một trang web cung cấp giải pháp OCR trực tuyến giúp người dùng có thể upload trực tiếp file cần OCR lên server và nhận lại kết quả dưới dạng text chỉ sau vài phút.

- Tại Việt Nam đã có chương trình nhận dạng Tiếng Việt có tên là VnDOCR do Phòng nhận dạng và Công nghệ Tri thức - Viện Công nghệ Thông tin nghiên cứu và phát triển. Bên cạnh đó còn có một dự án OCR Tiếng Việt có tên VietOCR (http://vietocr.sourceforge.net). Dự án này được phát triển dựa trên nền tảng mã nguồn mở tesseract-ocr do Google tài trợ. Các thầy cô có thể tham khảo bài của thầy Đặng Thanh Nghịhttp://dangthanhnghi.violet.vn/entry/show/entry_id/2038022

-----o0o-----

Phần mềm ABBYY FineReader là phần mềm OCR được đánh giá là tốt nhất hiện nay trên các diễn đàn tin học. Tuy nhiên đây là phần mềm có bản quyền! Trong bài viết này, Mạnh Hà muốn giới thiệu đến các thầy cô phần mềm FreeOCR

 ocr1_500

 Tải phần mềm: http://www.paperfile.net/freeocr.exe 

 

Bước 1: Thêm ngôn ngữ Tiếng Việt

Sau khi cài đặt, mặc định của phần mềm chưa có tiếng Việt, các thầy cô cần tải thêm gói tiếng Việt về:

http://solutions.weblite.ca/pdfocrx/languages.php 

http://www.verypdf.com/pdf2txt/ocr-language.htm

Sau khi giải nén gói tải về, ta có file: vie.traineddata

Chạy phần mềm, vào menu Settings > Open Language Folder

ocr2

copy file vie.traineddata vào đó

Đóng phần mềm và mở lại.

Bước 2: Cài đặt Font chữ và chọn ngôn ngữ

1. Settings > Change Font

ocr3

Chọn Font: Time New Roman

Mục Script chọn: Vietnamese

nhấn OK

ocr4

2. Mục OCR Language chọn: vie

ocr5

 

Bước 3: Thực hiện

ocr7_500

1. Chèn ảnh cần lấy chữ: Open

2. Nhấn OCR

3. Nhấn Save Text để lưu lại phần text đã lấy được từ ảnh

 

---Done---

Dùng thử 2 phần mềm: Phần mềm FreeOCR cho kết quả tốt hơn VietOCR.NET

ocr8_500

Kính chúc các thầy cô thành công!


Nhắn tin cho tác giả
Đỗ Mạnh Hà @ 12:08 17/07/2013
Số lượt xem: 12484
Số lượt thích: 0 người
Avatar

Rất hay! Cảm ơn thầy Hà chia sẻ thông tin:

Khi soạn thảo bài giảng điện tử, việc chép lại chữ trong các sách tham khảo, sách giáo khoa, sách nâng cao,... để đưa vào bài giảng, bài tập khiến các thầy cô giáo mất khá nhiều thời gian. Việc scan hoặc chụp ảnh lại trang sách để lấy chữ ra từ đó giúp cho các thầy cô thoát khỏi công việc gõ văn bản và tiết kiệm được rất nhiều thời gian!

Avatar

Cám ơn Mạnh Hà nhé! Phần mềm free thật tuyệt.

Avatar

CẢM ƠN THẦY HÀ ĐÃ CHIA SẺ!

Avatar

TVM Chào thầy Đỗ Mạnh Hà! Rất hân hạnh được đón tiếp thầy ghé thăm.

Avatar

Haha, vậy là có công cụ này rồi, từ nay tạm biệt gõ chữ lại, cũng không cần tìm cách bẻ hình nữa. Xin cám ơn Thầy Hà nhiều

Avatar

Gia nhập trang của thầy, chúc thầy và gia đình mạnh khoẻ, hạnh phúc. Thầy cho Hạnh xin  một số tư lệu nhé. Cảm ơn thầy.

Avatar

Ôi vào trang này mình cứ tưởng được đi dự "đám cưới" thầy Hà! Sao bây giờ mình mới là thành viên mới của bạn được nhỉ Cười nhăn răng

Avatar

À nhưng mà trên trang mới là một góc của "chú rể"Cười nhăn răng

Avatar

http://tinhbotnghe.violet.vn/ Quá hay,sinh động của web

Avatar

Nhờ thầy Hà sủa giúp trang http://tmlap08.violet.vn không biết vì sao không đăng nhập được để quản trị, xảy ra lỗi như hình dưới:

 
Gửi ý kiến