サイトの紹介と使い方created: 2021/09/26 modified: 2022/05/24
created: 2021/09/26 modified: 2022/05/24
概要
- さくらインターネットのVPSでCENTOSを使用します。
フォルダの準備
- 作業初期段階のフォルダ構成です。
- handwritten
- numbers
- train
- 0
- 1
- …
- 9
- test
- 0
- 1
- …
- 9
- train
- katakana
- train
- ア
- イ
- …
- コ
- test
- ア
- イ
- …
- コ
- train
- numbers
- パソコン上に上と同じフォルダ構成を作ります。
- パソコンからCENTOS上に同じフォルダ構成を転送します。
- 「handwritten」は、ルートフォルダです。
- numbersとkatakanaはモデル・グループです。
- 「train」は、学習用データのフォルダです。
- 「test」は、評価用データのフォルダです。
今回用意した画像に実用化テストのために後で画像を加える予定です。 - 1文字ごとに「train」に50枚、「test」に10枚格納します(枚数は暫定です)。
- 1文字ごとに末端に1つのフォルダを持ちます。
画像の準備
ステップ①-手書き画像をパソコンへ転送
- 実寸15mmx15mmで、横10マス、縦6マスを用意します。
- 手書きで1つの文字をマス内に60個手書きします。
- 画像をiPadで撮影して、Google Driveでパソコンに転送します。
ステップ②- 歪んだ画像を長方形にする「Perspective Image Correction」

- フリーソフト「Perspective_Image_Correction」を使いました。
- このフリーソフトには次の環境が必要です。
Frame Network 3.5

Perspective Image Correction の使い方
- 「File」⇒「Load source image」で対象ファイルを開きます。
- 「左上」⇒「右上」⇒「右下」⇒「左下」の順番で対象領域の4隅をクリックすると、赤い4角形ができます。
- 自動的に画面の右側に長方形に変形された画像が表示されます。
- 「File」⇒「Save corrected image」で、変形させた画像を名前を付けて保存します。
ステップ③- 画像調整
- フリーソフト「Firealpaca」を使いました。
処理手順
- フェンスで左上と右上を指定して囲み、クリップボードにコピーします。
- 「ファイル」⇒「クリップボードから新規作成」で新規ファイルを作成します。
- 「選択範囲」⇒「すべて選択」をクリックします。
- 明度:「フィルタ」⇒「色相」で明度を+50(例)にします。
- 強調:「フィルタ」⇒「アンシャープマスク」で半径を300、適応量を300%(例)にします。
- 2値化:「レイヤ」⇒「変換」⇒「1bitレイヤに変換」で2値化します。
- 解像度変更:「編集」⇒「画像解像度」で800x480pixelのサイズにします。
- マスキング:「ファイル」「新規レイヤ画像として開く」でマスクレイヤ画像を開きます。
- ノイズ除去:ノイズを除去します。
- 統合:「レイヤ」⇒「全てのレイヤを統合」でレイヤを1つに統合します。
- 保存:ファイルを保存します。
マスクレイヤ画像の作り方



- 「ファイル」⇒「開く」で適当な文字画像を開きます。
この画像はレイヤ1になります。 - 「レイヤ」⇒「追加」でマスクレイヤを作成します。
この画像はレイヤ2になります。 - RGBをすべて255に設定します。
- 「ペン」と「図形」を選択します。
- 1.で開いたファイルの枠線を消すように始点をクリックして、終点までドラッグします。
これを枠線全てについて行います。 - レイヤ1を非表示にして「ファイル」⇒「書き出し」⇒「PNG(透過PNG)」でファイル名を指定して保存します。
- 図2のような画像がFirealpacaで見えますが、ペイントで見ると真っ白な画像になっています(これでOKです)。
この画像は、「(透過PNG)」なので枠線以外の部分を元画像にマスクしません。 - これで完了です。
ステップ④-元画像を分割して1文字ごとのファイルにする
- フリーソフト「e-cutter」を使いました。
使い方
- 「ファイル」⇒「開く」でステップ⑤で保存した画像を選択します。
- 「分割」⇒「分割サイズ&オフセット設定」をクリックします。
- 「オリジナル画像の縦横比と合わせる」のチェックを外します。
- 横幅80、高さ80に設定します。
- 「分割」⇒「保存フォルダ設定」で出力フォルダを指定します。
- 「分割」⇒「分割実行」をクリックします。
- 分割したファイルの10個を「test」フォルダに移動します。
まとめ
- 全部で2290文字の準備を予定しています。
- 1日に4文字処理すると、570日かかりますね。約1年半です。
- 気長にいきたいと思います。
前の記事:001-01.手書き文字-日本語-人工知能で認識システム構築
次の記事:003-01.手書き文字-日本語-keras-基準モデルの構築