Google Cloud Vision API 與 tesseract-ocr 做中文文字辨識比較

目前 Google Cloud Vision API 的報價如下,相對於一年前開放的時候價格有下降 40 %,一年前的報價可以參考:gslin – Google Cloud Vision API 開放讓大眾使用

Google Cloud Vision API 每千次報價

拿 Google Cloud Vision API 與 tesseract-ocr 相對比,Vision API 明顯大勝。

比較基準:

  • tesseract 3.04.01, github 之官方 chi_tra traineddata
  • Google Cloud Vision API – 2017/02/16

OCR 比較圖 1  – 強悍!中華備戰經典賽 澳洲移訓”火力猛”

  • tesseract: 強悍! 中華傭戰鰹興賽˙澳洲′移訓”火丙弩孟”
  • Vision api: 強悍!中華備戰經翼賽 漢洲移訓”火ガ罡

OCR 比較圖 2 – 機捷試乘 機捷開放民眾試乘 預辦登機同步試辦

  • tesseract: 磯繹試乘 機捷開蘑寶民眾噩t乘 予頁辦豈機同步試辮
  • Vision api: 機捷試乘機 開放民眾試乘預辦登機同步試辦

OCR 比較圖 3 – 南韓三星李在鎔出庭 示威民眾在法院前抗議

  • tesseract:
  • Vision api: 南韓三星李在鎔出庭示威民眾在法院前抗議u



如果你覺得這篇文章不錯,歡迎打賞

BTH: 35QooNA82isrmQLmpEnqXpJoxeZmaPubPf

ETH:0x4cf61fea5EA842D202B85158d8b5e239C872De46

或是點選下方圖片贊助我一杯咖啡:

4 comments On Google Cloud Vision API 與 tesseract-ocr 做中文文字辨識比較

  • 可以請問一下
    怎麼使用GOOGLE VISION
    讓他辨識中文的呢
    我們專題在測試網頁版上 給他中文字他跑出來都是亂碼

    • 你的圖片有先切好嗎?如果沒有可能會讀不出來。或是你可以到 google vision 的首頁,他有個可以試用的地方,你可以先在那邊 debug

  • 我用大大妳的圖
    貼在GOOGLE VISION 首頁的試用區
    結果在TEXT區 沒有辨識出中文字 都是英文亂碼
    是Natural Language API 那邊要設定嗎?!

Leave a reply:

Your email address will not be published.

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料