サービス

YAIST

公開:2023年3月11日

更新:2023年3月11日

概要

近年,符号化文字集合Unicodeの更新とともに,中国や日本など東アジアで書かれた史料のテキストデータベースに利用できる漢字符号が大幅に増加しており,現在は合計9万以上の漢字が使用できる.その一方,史料の翻刻において,使用したい漢字の検索と入力補助が課題となる.CHISEやGlyphWikiなどのツールは漢字検索に利用できるが,翻刻支援を前提とした文字入力ツールはまだない.本サービスは,Unicode漢字符号を構成する部品と画数で検索し,検索結果を任意のフォーマットで出力できる.また,入力した異体字の正字を自動的に推薦するシステムも実装した.

サービスURL

https://yaist.lab.hi.u-tokyo.ac.jp/

ソースコード

https://github.com/toyjack/yaist

関連論文

「部品と画数で漢字を検索するためのUnicode入力支援ツール」 、 劉冠偉・中村覚・山田太造 、 『研究報告人文科学とコンピュータ(CH)』 、Vol. 2022-CH-128 、No. 2 、pp. 1-4 、 2022-02

関連リンク

https://github.com/toyjack/idsfind