白黒地帯

ゲームとか色々、Twitterに書ききれないことなど。

【SSTR】Capture2TextみたいなのをGoogle Vision API OCR でやるやつを作りました

2023/2/15
リニューアル版である『XSSTR』をリリースしました!
whiteblackspace.hatenablog.com
今後は更新はこちらに対して行い、『SSTR』としての更新は行わない予定です。
基本機能は同じなので是非試してみてください!


StaemWorld Dig2はいいぞ。

このツールは?

ゲーム画面をキャプチャして英→日翻訳できるツールです。ひらたくいえばCapture2Textです。
OCRはGoogle Vision API、翻訳はGoogle Translateを使用しています。
ただしどちらもGCPのキーが必要です。(ユーザーで取得してもらう必要があります。)
という感じで、個人で使ってるツールをとりあえず公開というレベルです。
UIもボタンの押しやすさ重視です。

あとCapture2Textと違う点としては、基本はマウス操作で、キャプチャ開始した時点のスクリーンショットを切り抜いて翻訳する感じです。
一瞬しか表示されないセリフ等も安心。
 ※ver1.3でショートカットキー操作にも対応しました。

精度どんなもんなの?って気になる人は一応参考になりそうな記事を書いたのでどうぞ。
whiteblackspace.hatenablog.com

動作確認済み環境

Windows 10

ダウンロード

【v1.3.0】

SSTR_v1.3.0.zip - Google ドライブ
※2020/12/18 リリースファイルミスを修正しました。

【v1.1.1】

SSTR_v1.1.1.zip - Google ドライブ

※ダウンロードボタンは右上にあります

名前はScreenShot TRanslatorの略です。

使い方

  1. Startボタンを押す
  2. スクリーンショットが表示される
  3. 読み取り・翻訳する部分をドラッグで選択
  4. 選択後、読み取ったテキストと翻訳が表示される

ざっくりとはこんな感じです。詳細は同梱readme.htmlをお読みください。

GCPキーの取得について

readmeにも記載していますが、初めにAPIを使うためのキーをGCPから取得する必要があります。
具体的には以下のような手順が必要です。
(1)GCPのプロジェクトを作成(GCPを開始していない人はまず登録から)
(2)Google Cloud Vision APIとGoogle Translate APIをプロジェクトで有効化
(3)サービスアカウントを作成 この時役割を「Google Translate管理者」に
(4)サービスアカウントキーをjsonでダウンロードし、keyフォルダに配置
詳細はこちら。
whiteblackspace.hatenablog.com

終わりに

まあ、個人的にはCapture2Text で実用に十分な精度だと思うんですが
GoogleのOCRが気持ち悪いくらい読むので皆に体験してほしいなあ…という思いで公開しました。
あとC2T、ショートカットキーでの起動がわりとゲーム中誤爆したりオーバーレイで表示されるはずの四角が表示されなかったりと、そのあたりがあまり合わなかったので
マウス操作で安定して切り出せるのは我ながら気に入ってます。

個人使用ツール公開とはいえいろいろボロボロですが…
ブラッシュアップしたり、一部制限ありでキー取得不要のフリソとして公開しようかなあ…という予定はありますので
GoogleのOCRめっちゃ読むやん!!って思った人はコメントとか残してもらえるとやる気出ます(?)