作成日: 2021/10/26 更新日: 2023/03/25 サイトの紹介と使い方
概要
- 日本語にはいくつかの文字種別が存在します。
- 例えば、漢字、ひらがな、カタカナ、数字、アルファベットなどです。
- 人工知能のモデル構築の過程で、それぞれがそれぞれで問題を抱えることが予想されます。
- そのため、文字種別をグループとし、その組み合わせ(複合体)をFamilyに分類したいと思います。
- すると、組み合わせの数は相当数になることが予想されるため、ここでFamilyを管理したいと思います。
グループ(group)
- 各文字種別をグループと呼ぶことにして、それぞれに名前を付けたいと思います。
- 数字:numbers
- カタカナ:katakana
Family
- F01-01:numbers
- F01-02:katakana
- F02-01:numbers,katakana