SSブログ

【ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム】要約まとめ [本/文学芸術]


ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム

ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム

  • 作者: ジョディ・アーチャー
  • 出版社/メーカー: 日経BP社
  • 発売日: 2017/03/23
  • メディア: 単行本


【ベストセラーコード/ジョディ・アーチャー他/17年3月初版】


1億冊売れる本って、たまにあるじゃないですか。
「ミレニアム」、「フィフティシェイズ」、「ハリーポッター」とか。

売れる本と売れない本のちがいは何なのか?
ベストセラーは予測できるのか?

先人たちは人力でがんばりました。

ジョゼフ・キャンベル
神話学の第一人者で、パターン認識の達人。
一生かけて世界中の物語を読み、そのなかの類似点をさがした。
ジョージ・ルーカスは、キャンベルの神話論をスターウォーズに採り入れた。

クリストファー・ブッカー
30年かけて本をよみ、すべての文学作品は7つの基本プロットにわけることができる、
という自説を証明しようとした。

時代は変わりました。ビッグデータ分析。本書は最新の統計学です。
むずかしいことはよくわからないですが、いろんな分析をしてる。
最短収縮重心法とか。なんじゃそりゃ。


▼広告▼





著者たちは何をしたのか?
まずNYタイムズのベストセラーリストをもとにして、ヒット小説を500冊選ぶ。
次にそれ以外に売れていない小説を4500冊選ぶ。
合わせて5000冊の小説から、テキストデータを用いたデータ分析を行った。


1章では概要を。
著者たちの予測モデルは、ベストセラーを80%の確率であてることができた。


2章はテーマについて。
売れるトピック(テーマ)とその割合について検討する。
コンピュータが示したのは、3つか4つの中心的なテーマが、
全体の30%を占める本が売れるということ。

ベストセラーにもっとも見られるテーマは人間関係で、登場人物の心の交流に焦点を当てたもの。
上位に来る他のテーマは、家庭、仕事、子どもの学校生活、最新テクノロジーがある。


3章はプロット(物語の構成を示した設計図)について。
過去30年でもっともヒットを飛ばした作品のプロットには、
共通して規則正しいリズミカルな鼓動があった。
三幕構成で、均整の取れたプロットラインが読者をひきつけること、
感情の起伏を計算して書くことが、世界的なヒットにつながることがわかった。


4章は文体について。
テーマやプロットが正しくても、文体がダメだとヒットはむずかしい。
日常の言葉をつかうべし。
ベストセラーは、I wouldではなくI’dといった略称が多く用いられ、
感嘆符 ! はあまり使われない。
sayやaskといったシンプルな表現をよく使い、
mutter(ぶつぶつ言う)とか、protect(抗議する)といった、
むずかしい言葉をつかうのは、売れない小説の共通点となる。


5章はキャラクターについて。
登場人物と動詞の関係。
ベストセラーの主人公は、want、needという頻度が明らかに高い。
さらにdo、think、smaile、reachといった主体性の高い動詞の頻度も多い。
売れない小説には、halt(立ち止まる)、drop(あきらめる)、wait(待つ)、
といった消極的な動詞の頻度が高い。




著者たちの数年間にわたる膨大な労力による研究は、
一言でまとめると以下のような結論となりました。

「ベストセラーになるには、現実的な舞台で、身近なテーマにフォーカスし、
口語体(短文で読みやすい文体)で、主体的な主人公を描くことを意識すべき」

どんなものでもそうですが、結論は「知ってた」という当たり前のところに落ちつきます。



日本語の場合どうするべきか?もちろん本書には書かれてません。

そういえば文体について、村上春樹の最近のエッセイに書かれてました。
なんども推敲して、「文章に空気を入れる」そうです。たしかそのような表現だった。
適切なタイミングで句読点をいれ、リズムをつくり、漢字をひらがなにして読みやすくする。
口頭で読んでみて、ひっかかるような表現は、徹底的に書きなおすそうです。

あと坂口孝則の研究から。過去記事より。
「文章の漢字比率は、28%以下に抑えるべき。
坂口氏はベストセラー本を裁断し、OCRを使って文字データ化した。
Visual Basicを使って、漢字比率を計算するプログラムをつくった。
ベストセラー本は、全文字数のうち漢字が25~28%を占めた。
漢字比率が30%を超えると堅くるしくなる。20%ならやわらかすぎる」

まあ漢字が多くて、ダラダラ長文で、むずかしい表現の文章なんか、
だーれも読まないですよね。書いた人の「おれは賢いんだ」という自己満足。
とはいえ平仮名だらけはハングルみたいに読みにくいし。中庸ですかね。

それは英語でもおなじで、本書でも以下のような話が出てました。
男性的文章=文語=英国文学的表現、 女性的文章=口語=米語
著者たちのモデルは、70%の確率で男と女の文章を当てるそうです。
男文章と女文章の比率が、50:50で書かれたものが、米国ではベストセラーになりやすいと。
へ~、英語でもそんなんあるんだと、ミョーに納得。

日本だと漢文=男性、ひらがな=女性のイメージがありますよね。
男もすなる日記といふ、紀貫之じゃないけど。
今だったら漢字比率が25%ぐらいがいい、という事になるのかな。
一概にはいえないし、あくまでイメージの話ですが。


以下に3つの読書メモを。


▼広告▼





アメリカの出版事情


アメリカでは毎年、約5万冊~5万5千冊のフィクションが出版されている。
国際標準図書番号を持たない、電子による自主出版は増加する一方なので、
この数字は控えめなもの。その中からNYタイムズのベストセラー入りするのは、
200~220ほど。分母の数を控えめに見積もってもその率は0.5%にも満たない。
米国でミリオンセラーとなるのは年間にせいぜい3~4冊ほど。

ベストセラーの80%は大手出版社5社で占められる。
大手はマーケティングに多額の予算を割くことができる。
とはいえ資金力がすべてとは言えない。

「フィフティシェイズ」は当初は電子書籍とオンデマンドのペーパーバックのみの発売。
マーケティングに費用は一切かけてない。
「ハリー・ポッター」のJKローリングはブルームズベリーから出版できるまで、
12社に断られている。しかも本業は辞めないように、とアドバイスまでされたという。
「ヘルプ 心をつなぐストーリー」のキャスリン・スケルトンは、
60のエージェントに断られた後に、ようやく「ヘルプ」を出版した。




アルゴリズムが選んだTOP100小説


ベストセラー予測モデルが選んだ完璧に売れる小説。
(とはいえ英語なので「翻訳の良しあし=文体」が日本では関係してくる)
日本発売されてる上位5冊を以下に。

1位:ザ・サークル/デイブ・エガーズ
6位:スカーペッタ/パトリシア・コーンウェル
9位:あたしの手元は10000ボルト/ジャネット・イヴァノヴィッチ
10位:ジェイコブを守るため/ウィリアム・ランディ
11位:最後の紙面/トム・ラックマン

1位の小説。

ザ・サークル

ザ・サークル

  • 作者: デイヴ エガーズ
  • 出版社/メーカー: 早川書房
  • 発売日: 2014/12/19
  • メディア: 単行本(ソフトカバー)



6位の小説。

スカーペッタ (上) (講談社文庫)

スカーペッタ (上) (講談社文庫)

  • 作者: パトリシア・コーンウェル
  • 出版社/メーカー: 講談社
  • 発売日: 2009/12/15
  • メディア: 文庫





shazamとは何か?その影響は?


アメリカの音楽業界の問題。
shazamというスマホアプリがある。
街角で気になった音楽を、鼻歌で入力すればそれが誰の曲なのか、検索することができる。
これは消費者だけでなく、音楽制作サイドにも大変な価値を持つ。
なぜなら「1曲のうち、どこの、どのフレーズが印象に残って検索されたか」、
という情報を簡単に得ることができるからだ。

そのデータを参考に「消費者の心を捉えそうな箇所」をちりばめた楽曲を制作し、
プロモーションしたりするようになる。

その結果ヒットチャートの多様性は急速に失われつつあるそうだ。
上位のヒット曲が占める割合は極端に大きくなり、
コード進行もサウンドも、似たようなものが増えてきたという。

小説もPCが執筆したり、ベストセラー予測モデルが浸透すると、
同様のことが起きる可能性がある。

ただ音楽の世界はスタイルチェンジが起こった。
80年代の米国では、派手な長髪をスプレーで固めたロックスターが、
高速なギターソロといったスタイルで一世を風靡した。これが当時の「ヒットの法則」。

しかし90年代、グランジ(薄汚れた)たちがオルタナ(取って代わる)した。
日本ではそのままグランジとかオルタナと呼ばれる。

おそらく小説の世界でも、本書の統計モデルが知りわたり、
ベストセラーの多様性が失われると、どこかのタイミングでオルタナされるだろう。




80年代のヘビメタのことでしょうか。いまとなってはヘアメタルとか言われてますが。
どっちかというとヘアメタルはサブカルで、本流はデュランデュランやカルチャークラブ。
メタル系は米国チャートであんまり上がらんかったです。一部のバンドを除いては。

当時はMTV全盛。第二次ブリティッシュインベージョンに、マイコ―やプリンスの黒人が絡む。
ヴァンヘイレンは別格として、80年代売れ線ヘビメタ(ハードロック)は以下の流れ。
デフレパード⇒クワイエットライオット⇒ナイトレンジャー⇒ボンジョビ
あと好き者がオジーとかAC/DCおしてた。もっと好き者はメイデンとかジューダス。

ヘアメタルで印象深いバンド、Twisted sisterで、We’re not gona take it♪




Stay Hungry

Stay Hungry

  • アーティスト:
  • 出版社/メーカー: Atlantic / Wea
  • 発売日: 2000/03/13
  • メディア: CD




(関連記事)
【文章読本/谷崎潤一郎/1934年初版】の要約読書メモ
http://donhenley.blog.so-net.ne.jp/2013-12-14

【文章読本さん江/斎藤美奈子】要約まとめ
http://donhenley.blog.so-net.ne.jp/2017-04-25

【いい文章には型がある】~文章には3つの型がある
http://donhenley.blog.so-net.ne.jp/2013-05-04

【いい文章の書き方のコツ】~「書く力/池上彰」より
http://donhenley.blog.so-net.ne.jp/2017-04-04

▼広告▼




nice!(21)  コメント(4)  トラックバック(0) 
共通テーマ:

nice! 21

コメント 4

青山実花

Twisted sisterいいですね。
PVに見入ってしまいます^^

メタル系のライブに行きたいのですが、
彼らはまだ活動しているのでしょうか(笑)。
by 青山実花 (2017-06-24 13:01) 

seawind335

AIで曲のヒットする確率が分かるそうですが、そのうち書籍もヒットする確率が分かるようになるのかも知れませんね。。。。
by seawind335 (2017-06-25 18:12) 

don

青山実花さん、こんばんは~
活動してると思いますよ。再結成。
メタル系ですか。若返りそうですが、ちょっとしんどいかも^^;
[__犬]
by don (2017-06-25 19:57) 

don

seawind335さん、こんばんは~
そうなんですか。曲のヒット確率がわかるんですか。
すごい時代になりました。AIは賢いですね・・
[__犬]
by don (2017-06-25 19:59) 

コメントを書く

お名前:[必須]
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

トラックバック 0

トラックバックの受付は締め切りました

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。