07-08-2013, 11:43 AM
why1812 写:
在简体系统下OCR的结果和繁体系统是一样的。
可以推論辨認最重要的因素就是OCR ENGINE,程式主要是執行週邊的工作…
辨認錯誤,要改進就一定要從根源的OCR ENGINE著手,看來都沒有什麼解救了!
SubToSrt在這方面加進了學習功能,所以將新的字加進字庫便可以改善辨認效果,這是比這個程式優勝的地方。
至於一個字變成多個字的情況,其實應該可以解決;因為中文字是方塊字,基本上都是等寬的,所以OCR ENGINE應該從這個方向去改善(我猜這是因為其他語言沒有這個特性,所以編寫程式的都沒有去考慮這個方向),就不會將一個字變成幾個了。
在繁體系統下,如果用未經漢化的版本,一定要對程式相當熟悉,因為我們看不到那些說明呢!