015-01.手書き文字-日本語の似ている文字の洗い出し

サイトの紹介と使い方動画


created: 2021/10/25 modified: 2021/10/29

概要

  1. 日本語には人の目で見たとしても似た文字がたくさんあります。
  2. 人工知能で手書きの文字を認識させる時、学習の問題なのか、似た文字のそもそもの問題なのか判別することは困難です。
  3. 人工知能で手書きの文字を処理した後、手作業を行うことを考えれば、問題を解決するよりむしろ、手作業を楽にすることを優先させたいと思います。
  4. そこで、人工知能が似ていると判断する文字を洗い出したいと思います。

判断プログラム

1グループ対応 :014-01.py

共有変数と関数-c001.py

c001.手書き文字-日本語-共有ソースを参照してください。

import os,glob,sys
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.models import model_from_json

import c001_env as env

def main():
    json_string = open( env.fs_json,'r' ).read()
    model = model_from_json(json_string)
    model.load_weights( env.fs_hdf5 )

    c_eval = sys.argv[2]
    env.eval_char( model,c_eval )

    print( 'success' )

main()

Family対応 :014-51.py

共有変数と関数-c002.py

c001.手書き文字-日本語-共有ソースを参照してください。

import os,glob,sys
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.models import model_from_json

import c002_env as env

def main():
    json_string = open( env.fs_json,'r' ).read()
    model = model_from_json(json_string)
    model.load_weights( env.fs_hdf5 )

    group = sys.argv[2]
    c_eval = sys.argv[3]
    env.eval_char2( model,group,c_eval )

    print( 'success' )

main()

人工知能が似ていると判断する文字の一覧

  1. 認識率は、モデルファイル(hdf5)と連動するので、以下は目安です。

0~30%の認識率

katakana> チ:キテ
katakana> フ:7

31~50%の認識率

numbers> 5:046ハ
katakana> タ:ヌ07サ

51~69%の認識率

katakana> イ:6ク
katakana> ナ:キサエ

前の記事:014-01.手書き文字-日本語の文字を外部評価-教師有り
次の記事:

お問合せ・御要望

  • お問合せ
  • トップへ戻る
    タイトルとURLをコピーしました