2018年10月17日水曜日

小説を統計で見る「数字が明かす小説の秘密」

現在、日米衝突の根源 1858-1908を読んでいて、その延長でユダヤ人の起源: 歴史はどのように創作されたのか (ちくま学芸文庫)「民族」で読み解く世界史を購入したところ、本書が関連やら推奨やらで表示されていたので、釣られて購入した。
【目次】
  1. 控えめに用いなさい
  2. 彼の書き方、彼女の書き方
  3. 文章に「指紋」はあるのか
  4. お手本にならって書くべし
  5. バカになっていく文章
  6. イギリス対アメリカ(ハリー・ポッター・インヴィジョン)
  7. クリシェ、反復、お気に入り
  8. 表紙から本を判断するには
  9. はじめ方と終わり方
【要約】
  • -ly副詞は少ない方が良い。
  • 平均49/10000語以下だと好評。
  • 平均50/10000語以上だと不評。
  • 5章バカになっていく文章にも共通するが、簡潔さが重要。
  • 4章お手本にならって書くべしでは、近年「Very」など装飾語が減ってきている。
  • ある作家の特徴的な言葉は、2次創作においてオリジナルの頻度よりも高く利用される。

【単語の統計上、女が書いたように見えるが男が書いた本】

チャタレイ夫人の恋人を未読だが、検索結果にスリーピングビューティー ~禁断の悦び~(字幕版)が表示されていた。
漠然とヨーロッパ映画を見たくて見た作品だが、これは影響下にあった作品なのか。

【単語の統計上、男が書いたように見えるが女が書いた本】

肩をすくめるアトラスは未読だが、#151岡田斗司夫ゼミ11月6日号『聲の形観たよ&アメリカ大統領選現地行ってきたよ語りSP』で題名だけは知っていた。
鵜呑みにすれば、一時期のアメリカの土台であったとか。
記憶していなかったが、女性作家だったのか。

面白いのは、2014年以前で近年のトップセラー小説では、単語の統計上で作者の性別予測は100%的中している。
つまり、提供者と消費者が自ずと単純化された商品を望んでいる。