SIPs: 統計的に少ないフレーズ(その本独特の表現)

via Goma さん id:Gomadintime:20050506:p1
こりゃ面白い。試しにゲド戦記(こちら)や光の王(こちら)を見たけど、ズバリはないですね。指輪は統計出てない模様。
アルゴリズムを考えてみる。データベースから、単語i の頻度 Pi, 単語i と単語j が連続する頻度 Pij, 三つ連続する頻度 Pijk などを計算。Pij/(Pi Pj) や Pijk/(Pi Pj Pk) が極端に低い組合せがあったらリストアップ、て具合かな。作中で五回以上くらい出たらリストしてるようだ。
実はスタージョンの『人間以上』を英語で読んだときにそういうことを考えたことがあった。この本はデータがまだないようだ。代わりにブラッドベリの Something Wicked This Way Comesを見てみたけど、"autumn people" というのしかSIP はなかった。
追記:『ニューロマンサー』のSIP は"毒嚢"とか"新しい膵臓"とか(w
追記:イーガン作品だと "local death" というのがあった。これもイーガンらしい。人格コピーの一つが死ぬこと。バックアップから復活できる。