
2.帳票スキーマ認識技術
帳票スキーマ認識技術は、電子帳票の罫線枠で囲われた領域を要素として帳票のデータ構造を認識します。罫線枠で囲われた領域を背景色に基づき項目名、項目値、その他のいずれかに分類します。次に項目名と項目値の組合せから様式内部の表{1)縦表と横表、2)直交表、3)縦列挙と横列挙}を抽出します。さらにこれらを組合せて構成される複雑な様式を認識するため、包含関係を用いた認識処理を行い帳票スキーマの認識を行います。様式の配置によらないロバストな認識を実現しています。
図3 帳票スキーマの認識イメージ
![]() 1.電子帳票認識とデータ操作技術の詳細 |
![]() TOP |
![]() 3.帳票スキーマを用いたデータ操作技術 |