016-01.手書き文字-モデルの構築基準

作成日: 2021/11/02 更新日: 2023/03/25 サイトの紹介と使い方

概要

  1. モデル構築には次の3つが影響します。
    1. モデルのパラメータ(これが最も影響が大きいです。)
    2. epoch数
    3. batch_size
  2. 他にも影響を与えるものがいくつかありますが、今回は上記だけの調整で行いました。
  3. そして、同じ条件でも確率的に異なるモデルが構築されるので、同じ条件でいくつかモデルを構築しました。

内挿と外挿

  1. 人工知能に限らず、最小二乗法を用いて何かを予測しようとすれば、必ず内挿と外挿が存在してきます。
  2. 人工知能で文字認識をさせるときの内挿と外挿の意味は次の通りです。
    1. 内挿:モデルの学習に用いた手書きの画像
    2. 外挿:モデルの学習に用いていない手書きの画像

モデルの構築基準

  1. 内挿のデータ(手書き文字画像)を評価すると、ほぼ100%の確率で文字を認識します。
    1. 時折、50%などの文字が出現することがありますが、これは学習させた文字の画像がおかしいなどの理由があるので、必ず100%に近くなるように修正します。
  2. 外挿のデータ(手書き文字画像)を評価すると80%~85%の確率で文字を認識しました。

課題

  1. 似た文字が認識率を低下させているので、なんらかの対処が必要です。
  2. 学習用データと評価用データが少ないので、増やす必要があります。
    1. 手書き文字作成の労力が必要です。
    2. 大きなデータのモデル構築のために高速なコンピュータが必要です。

前の記事::
次の記事::

お問合せ・御要望

お問合せ
Verified by MonsterInsights
タイトルとURLをコピーしました