Automatic Acquisition of Predicative Frozen Patterns on One Directional Association

1995 
本論文では「目を盗む」や「かたずを飲む」などの述語型定型表現をコーパスから自動抽出することを目的に, 従来の相互情報量の条件を緩める方向で, 名詞動詞間の共起性を測る新たな基準を提案する. 概略, 名詞, 動詞のどちらかを固定して, その単語と共起する集合内の各単語に, どの程度特異な頻度になっているかの数値を与える. この数値は集合内のその単語の頻度の割合と, 集合内の単語の種類数から計算される. この数値の上位のものを取り出すことで定型表現の抽出を行う. 本手法の特徴は, 名詞を固定した場合に抽出できる表現と, 動詞を固定した場合に抽出できる表現はほとんど共通のものがなく, しかもどちらの場合も相互情報量による抽出程度の正解率を得られることである. このため, 目的の抽出数の半数つつを名詞固定と動詞固定の各々の場合から取り出せば, 相互情報量を用いて抽出する場合よりも高い正解率が得られる.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []