vozForums
Về việc các vấn đề gần đây xoay quanh vụ Trung Quốc

Go Back   vozForums > Máy tính để bàn > Phần mềm > Download


Reply
 
Thread Tools
  #1  
Old 11-12-2009, 20:58
0904223800's Avatar
0904223800 0904223800 is offline
Senior Member
 
Join Date: 10-2006
Posts: 1,024
Send a message via Yahoo to 0904223800
Phần mềm nhận dạng tiếng Việt (Mã nguồn mở)!

Trước đây có máy scan cứ phải mua phần mềm Vietdoc của Viện Công nghệ thông tin với giá khoảng 8 tr/bản. Đắt mà chất lượng bình thường.

Mới tìm được phần mềm vietocr sử dụng mã nguồn mở, xác xuất nhận dạng đúng hiện nay là 97% và phiên bản sau sẽ nâng lên hơn nữa.

VietOCR, hiện có trong Java and .NET executable, là một GUI frontend cho Tesseract OCR engine. Cả hai phiên bản đều có giao diện tương tự và có cùng khả năng nhận diện ký tự từ các loại dạng ảnh phổ thông. Chương trình còn có khả năng vận hành như một ứng dụng console, thi hành lệnh từ command line.

Batch processing cũng được hỗ trợ. Chương trình theo dõi một watch folder cho các tập tin ảnh mới, tự động xử lý chúng qua OCR engine, và xuất kết quả nhận dạng ra một output folder.

Language data cho Việt ngữ và Anh ngữ đã được gói kèm với chương trình. Data cho các ngôn ngữ khác có thể hạ tải từ Tesseract website và cần đặt vào tessdata folder.

http://vietocr.sourceforge.net/



Chương trình chạy tốt trên win 7 64 bit, lưu ý là khi scan nên để độ phân giải của máy từ 200 trở lên
Reply With Quote
  #2  
Old 11-12-2009, 22:45
walkmansky's Avatar
walkmansky walkmansky is offline
Bán nước mía dạo
 
Join Date: 03-2008
Location: Ghibli Studio
Posts: 14,790
Send a message via Yahoo to walkmansky
Re: Phần mềm nhận dạng tiếng Việt (Mã nguồn mở)!

thnk, đang tìm cái này
Reply With Quote
  #3  
Old 11-12-2009, 22:59
0904223800's Avatar
0904223800 0904223800 is offline
Senior Member
 
Join Date: 10-2006
Posts: 1,024
Send a message via Yahoo to 0904223800
Re: Phần mềm nhận dạng tiếng Việt (Mã nguồn mở)!

Nếu bro có văn bản font tcvn3 và vni thì cài thêm cái bộ font, việc nhận dạng sẽ chính xác hơn
Reply With Quote
  #4  
Old 12-12-2009, 11:40
LPtuancong's Avatar
LPtuancong LPtuancong is offline
Senior Member
 
Join Date: 02-2008
Location: |̲̲̲͡͡͡ ̲▫̲͡ ̲̲̲͡͡π̲̲͡͡ ̲̲͡▫̲̲͡͡ ̲|̡̡̡ ̴̡ı̴̡̡ ̡͌l̡ ̴̡ı
Posts: 1,278
Send a message via Yahoo to LPtuancong
Re: Phần mềm nhận dạng tiếng Việt (Mã nguồn mở)!

thanks anh zai,đang cần
Reply With Quote
  #5  
Old 12-12-2009, 14:29
photocopyvn photocopyvn is offline
Junior Member
 
Join Date: 06-2009
Posts: 17
Re: Phần mềm nhận dạng tiếng Việt (Mã nguồn mở)!

chủ thớt cho cái hướng dẫn cài bản .net chi tiết và lỗi hay gặp với. Thank.
Reply With Quote
  #6  
Old 12-12-2009, 20:22
photocopyvn photocopyvn is offline
Junior Member
 
Join Date: 06-2009
Posts: 17
Re: Phần mềm nhận dạng tiếng Việt (Mã nguồn mở)!

Iem cài bản .net mà bị lỗi hoài, không dùng được.
còn cái vndocr 4 demo thì hem thèm. chẳng được gì cả. vứt đi.
Reply With Quote
  #7  
Old 12-12-2009, 20:54
FullOfLove's Avatar
FullOfLove FullOfLove is offline
Senior Member
 
Join Date: 09-2007
Posts: 5,478
Re: Phần mềm nhận dạng tiếng Việt (Mã nguồn mở)!

xài win 7 đi có sẵn .NET
Reply With Quote
  #8  
Old 12-12-2009, 22:26
0904223800's Avatar
0904223800 0904223800 is offline
Senior Member
 
Join Date: 10-2006
Posts: 1,024
Send a message via Yahoo to 0904223800
Re: Phần mềm nhận dạng tiếng Việt (Mã nguồn mở)!

Đang cài trên win 7 x64, chạy tương đối ổn, thỉnh thoảng bị lỗi ở memory nhưng check trên mạng đó là do lõi của ocr engine nên chịu. Hy vọng bản Tesseract lõi mới sẽ khắc phục lỗi này và nâng cao độ chính xác.
Nhận dạng văn bản đánh máy ở thế giới coi như đã được giải quyết, hiện nay đang tiếp tục giải quyết vấn đề nhận dạng chữ viết tay.
Theo ý kiến của mình soft này hay hơn vietdocr, nhất là ở điểm mã nguồn mở
Reply With Quote
  #9  
Old 12-12-2009, 23:38
htrung htrung is offline
Senior Member
 
Join Date: 08-2007
Posts: 539
Re: Phần mềm nhận dạng tiếng Việt (Mã nguồn mở)!

Quote:
Originally Posted by 0904223800 View Post
Nhận dạng văn bản đánh máy ở thế giới coi như đã được giải quyết, hiện nay đang tiếp tục giải quyết vấn đề nhận dạng chữ viết tay.
Theo ý kiến của mình soft này hay hơn vietdocr, nhất là ở điểm mã nguồn mở
Engine này là từng một trong những engine nhận dạng tốt nhất thế giới, giờ lại được google phát triển, vietdocr hay VNDocr làm sao có cửa so lại được
Reply With Quote
  #10  
Old 12-12-2009, 23:57
backhanhchung backhanhchung is offline
K.I.A
 
Join Date: 12-2007
Posts: 937
Re: Phần mềm nhận dạng tiếng Việt (Mã nguồn mở)!

Quote:
Originally Posted by 0904223800 View Post
Đang cài trên win 7 x64, chạy tương đối ổn, thỉnh thoảng bị lỗi ở memory nhưng check trên mạng đó là do lõi của ocr engine nên chịu. Hy vọng bản Tesseract lõi mới sẽ khắc phục lỗi này và nâng cao độ chính xác.
Nhận dạng văn bản đánh máy ở thế giới coi như đã được giải quyết, hiện nay đang tiếp tục giải quyết vấn đề nhận dạng chữ viết tay.
Theo ý kiến của mình soft này hay hơn vietdocr, nhất là ở điểm mã nguồn mở
- Còn lâu mới giải quyết triệt để được bạn ạ!
Reply With Quote
Reply

Thread Tools

Posting Rules
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is On
Smilies are On
[IMG] code is On
HTML code is Off

Forum Jump





All times are GMT +7. The time now is 15:19.


Steam Powered by vBulletin® 0.1 pre-alpha
Copyright ©2000 - 2014, Jelsoft Enterprises Ltd.