及川直彦のテキストのアーカイブ

及川直彦が書いたテキストと興味を持ったテキストのアーカイブ

精緻化見込みモデルもしくは二重過程理論についてのメモ

昨晩のゼミでは、メンバーと購買行動プロセスについてしみじみと考えたのですが、その際に論点となった「精緻化見込みモデル」について補足資料を探していたら、日本マーケティング学会の「マーケティングジャーナル」によく整理されたレビューがありました。
"精緻化見込みモデルでは,人間の情報処理は, 「中心ルート」と「周辺ルート」を経て行われ,態度変容が起こるとされている。中心ルートによる情報処理では,認知的労力を要し,比較的多くの情報処理活動を行う。その一方で,周辺ルートによる情報処理では,認知的労力を要さない情報処理を行う。" ”中心ルートの情報処理では,問題や意見の中心的なメリッ トやデメリットなど,メッセージの本質的な内容を精査し,その内容が態度形成に影響を及ぼす。一方の周辺ルートの情報処理では,情報の送り手の魅力や専門性など,メッセージの本質的な内容とは関係のない,周辺的手がかりが態度形成に影響を及ぼす。”
このモデルは、行動経済学者のダニエル・カーネマンのベストセラー「ファスト&スロー」で有名になった「システム1」(高速で,並列的,自動的,努力を要さない,連想的,学習が遅い,情動的という特徴があり,直感型の情報処理)と「システム2」(低速で,逐次的,制御的,努力を要する,規則に支配される,柔軟的,中立的などが特徴として挙げられる,熟慮型の情報処理)の二つの思考モードの概念とも近いです。
ざっくりと言ってしまえば、「中心ルート」≒「システム2」、「周辺ルート」≒「システム1」と理解していただければよろしいかと存じます。
昨晩のゼミのメンバーの議論をまとめると、
1) 広告に接する場面では、生活者は「周辺ルート」「システム1」であることが多く、そのような場面において「中心ルート」「システム2」による情報処理を期待すると、広告が期待した効果を得られなくなる。そこで、広告のクリエイティブのプロフェッショナルたちは、「周辺ルート」「システム1」の生活者を情報処理に誘導する表現・コンテンツを創るよう工夫をしている。
2) その一方で、オンラインで情報を能動的に探索する場面では、生活者は「中心ルート」「システム2」であることが多く、そのような場面においては、検索エンジンやオンライン上のクチコミの情報が有効に機能する。
3) カテゴリーに対する関与水準が低い場合には、「中心ルート」「システム2」を経ずに、「周辺ルート」「システム1」だけで購買を決定することもしばしばあるが、カテゴリーに対する関与水準が高い場合には、「中心ルート」「システム2」が入ってくる。
4) カテゴリーに対する関与水準が高い場合には、検索エンジンが使いやすくなり、オンライン上のクチコミの情報が豊富になってくる中で、「周辺ルート」「システム1」の生活者を情報処理に誘導する表現・コンテンツの影響力が相対的に下がってくる可能性がある。
といったところでしょうかね。

(2020年5月30日にFacebookに投稿したテキストを再掲)

「技術の社会的形成」についてのメモ

宮尾学先生の「技術の社会的形成」に関する以下の2つの文章を読みました。
この文章を読んで、マーケティングの実務の視点から感じたことをメモします。
  • マーケティングにおいて、新たなカテゴリー・ニーズを確立するプロジェクトは、すでにあるカテゴリーの中で自社のブランドを差別化していくプロジェクトよりも、マーケッターによって好みの違いはあるかもしれませんが、一般的にはワクワクするものでしょう。
  • しかしながら、そういうプロジェクトは、ワクワクするとともに、いざ取り組んでみると、なかなか難しいものでもあります。
  • 確立したいカテゴリー・ニーズが顧客の潜在的なニーズと一致していて、そのニーズを感じる顧客にある程度の規模があり、これまでそのニーズを満たす製品・サービスを提供している手強いプレイヤーがいなかったとするならば、それは良い兆候です。
  • しかしながら、カテゴリー・ニーズがある程度の規模の顧客の潜在的なニーズと一致していて、手強い競合がいなかったとしても、それだけでカテゴリー・ニーズを確立できるわけではありません。
  • 例えば、これまでのやり方ではコストが高すぎたり、鍵となる機能のスペックが足りなかったりしたために満たすことが難しかったカテゴリー・ニーズを満たすことを可能にする「新しい技術」は、確かにカテゴリー・ニーズを確立するための鍵となりますが、そのような技術の力だけを頼りに一点突破するアプローチは、なかなかうまくいきません。
  • 「新しい技術」は、カテゴリー・ニーズを解決しうる製品・サービスのアイディアを持つ開発チームと相互的に作用する中でその活用の仕方が見出されるものであり、製品・サービスのアイディアは、そこで想定するカテゴリーの範囲に止まらず、トレンドや規制、市場の経済的な変化といった多様な外部要因と相互的に作用する中で磨きこまれるものです。
  • また、自社単独でカテゴリー・ニーズを確立しようとするのではなく、そのビジネス生態系の中で異なるレイヤーのプレイヤー(例: メーカーにとっての小売やメディア)と連携したり、あるいは、ほどよく競合するプレイヤーが登場したりした方が、結果としてより広いターゲットに、より深くカテゴリー・ニーズを確立できるものです。
  • このような、多様なモノと主体が絡み合いながら、カテゴリー・ニーズを確立していくメカニズムを、単純化しすぎず、本質的な「勝負どころ」を捉えらえるようにモデル化していくアプローチとして、「技術の社会的形成」は、なかなかいいかも、と感じました。
続けて、認識論の観点から感じたことをメモします。
  • かつてトマス・クーンは、ある時代の科学者たちの間で真理だと信じられていた世界を解釈するモデル=パラダイムは普遍的なものではなく、そのパラダイムがフィットしない事象に直面した別の時代の科学者たちの間で、それまでとは別の世界を解釈するモデルの方がフィットする=真理らしいとコンセンサスが得られれば、パラダイムはガラリと変化する(例: 宇宙の捉え方が天動説から地動説に転換、物が燃えることの捉え方がフロギストン説から酸化説に転換)と論じました。
  • 私たちにとって真理らしいものは、実は、科学者のコミュニティ内の相互作用や、科学者のコミュニティとそれ影響を与える社会との相互作用に影響されて形成されている=社会的形成の産物であると言えるでしょう。
  • パラダイムが社会的形成の産物であるように、私たちがある技術に着目し、そこに、これまでのモデルでは解決できなかったものを解決できる非連続的なモデル(イノベーション)の可能性を見出すことも、社会的形成の産物でしょう。
  • イノベーションは、そこで着目される技術の性質のみによって決定されるのではなく、その技術に対して人々がまず個々の解釈を見出し、異なる解釈を持つ人々の間の相互作用を通じて次第にあるモデルがコンセンサスを得て、形成されていくとするならば、この形成されたモデル自体の内容を整理するだけでなく、このモデルが形成されるに至った相互作用を見ていった方が、よりそのモデルへの理解が広がり、深まるでしょう。
  • 例えば「デジタル・トランスフォーメーション」の議論も、今日語られていることだけでなく、ここに至る相互作用の部分まで視野に入れて考えた方が良いでしょう

(2020年4月12日にFacebookに投稿したテキストを再掲)

Perfumeファンのセグメンテーション仮説ver.1

Perfumeのライブに行くと、同じ会場にいる観客の中でも、複数の異なるタイプの顧客がいることを感じます。さすがにいつもの仕事や学術研究のように、調査票の50くらいの質問に回答いただいて因子分析をする手間はかけていないのですが、以下私のライブ、知人からのコメント、ネットの発言などの観察に基づいて解釈したセグメンテーション仮説 ver.1です。

セグメントI:
地下アイドル発掘マニア Pefumeの名前を私が最初に知ったのは、私の同居人(妻)から、彼女のネットコミュニティの友人がPerfumeが凄いと言っているという話でした。確か2000年代中盤頃、今考えると、おそらく2007年の「Polyrhythm」(https://www.youtube.com/watch?v=KbiSxunJatM)が発売された頃。「広島の地下アイドルがテクノに転向して、なんか面白いことやっていて」というその友人のコメントを伝え聞いたのが私の最初のPerfumeとの接点だったと記憶しています。(そのときに、「ふ〜ん、テクノに転向したアイドルねぇ〜」と冷たいリアクションをした自分の先見の明のなさを、今となっては悔やんでも悔やみきれないです。)「Polyrhythm」の一年前の「Perfume〜Complete Best〜」発売後の引退の噂(実は噂ではなくマジだったらしい)に対抗して、YouTubeに映像をアップした伝説の人たちも、ここに分類していいでしょう。 このままだと引退してしまいそうな、あの真面目で一生懸命な娘たちをなんとかしたいという「育てゲー」、メジャーになった後は見守っていなければという「保護者モード」が、彼ら・彼女らをドライブする要因のようです。ライブでも、この方々らしい、やや年齢高めの男女の方々を1割くらい見かけます。

セグメントII:
ザ・アイドルファン Perfumeのライブに行くと、男性ひとりか、男性二人組で来ている人たちがいます。見ていると正直ちょっと○○イのですが、隣りに座ると礼儀正しくて感じよい方だったりします。メンバーとの結婚を夢見ている人たちはその後の諸々の報道でさすがに減ったのでしょうが、今でも疑似恋愛が彼らをドライブする要因なのでしょう。 この方々が最近のライブでもおそらく4割くらいで、おそらく今でも最大の勢力だと思います。この方々が今でもPerfumeを支えているのは間違いないので、メンバーのハッピーなニュースにめげず、どうかこれからもずっとファンでいてください。

セグメントIII:
なんとなくTECHNO/EDMファン Perfumeの中に懐かしいTECHNO POPの要素や、EDMの要素を見出だして興味を持っている人たちです。Perfumeに関する会話で、同時に「中田ヤスタカ」「cupsele」あるいは「真鍋大度」「Rhizomatiks」といった固有名詞が頻出する人たちです。 ここ数年のEDM系のインターネットラジオで、ボーカルが日本語のかっこいい曲がよく流れるなぁ、と思っていたら、それが後に「Party Maker」(https://www.youtube.com/watch?v=rFcnCCX2kN8)という曲であるということを発見してPerfumeを聞き始めた私もここに入るでしょう。 Cannes Lions 2013における「Spending All My Times」(https://www.youtube.com/watch?v=RKBpq8te6MY)や、SXSW 2015における「Story」(https://www.youtube.com/watch?v=zZiPIgCtIxg)みたいなバキバキのパフォーマンスが好きな反面、「Cling Cling」(https://www.youtube.com/watch?v=guqVgQFvXXY)のような「今さらまだアイドル路線かい」という曲には反感を感じる彼ら・彼女らが、今回のアルバムとライブで、アレンジをがらりと変えた「Cling Cling」に踊らされることになるとは、おそらく予想できなかったでしょう。今回のライブではざっと3割くらいでしょうか。 このファン、とにかくPerfumeがやることにいちいちクリティカルでうるさいです。もっと素直にPerfumeを楽しんでもよいのではないでしょうか。

セグメントIV:
共感しても安心なメジャーなもの好き Perfumeがメジャーになってから、その誰もが疑わないメジャーな存在であること、でもよく聞くと、そこに至るまでには私たちのようなべたな苦労していたというエピソードもあることを知り、ますますファンになっている人たちです。この層は、おそらくJPN以後取り込んだ女性層が多いような気がします。今回のライブではざっと2割くらいでしょうか。 この層が入ってくれることで、Perfumeのファン層が増えてくれていること、感謝です。

上記がざっくりとしたPerfumeファンのセグメントの仮説です。今日段階ではざっくりし過ぎている感がありますので、随時加筆・修正を試みます。

さて、今後の展開ですが、セグメントI、II、IIIをうまく取り込み続け、新たにセグメントIVを広げていくことで、海外マーケットに広げるMomentumが創れれば、確かにこの全セグメントが幸せになります。しかしながら、さじ加減を間違えると、セグメントIIが離脱するか、セグメントIIIが離脱するかとなり、いずれかが離脱したらセグメントIVが「メジャーでないもの」となるため離脱する、という危険もあります。

容易ではないチャレンジだとは十分存じ上げていますが、前者となる幸運を心から祈っております。 そして私も、ささやかながらNew York公演に応援に行きますよ。

(2016年7月4日にFacebookに投稿したテキストを再掲)

ジョン・スノウの文献(エビデンスに基づくコレラの防疫策の導出)

エビデンス(妥当な方法によって得られた統計データの分析結果に基づく科学的根拠)による問題解決の先駆者として、また、「疫学の父」として知られている、外科医ジョン・スノウの、コレラの防疫策を導出した分析の原典です。 水道会社のSouthwark and Vauxhall Companyから水道を供給されていた世帯のコレラによる死亡率が、Lambeth Companyから水道を供給されていた世帯の約8.5倍というエビデンスに着目し、Southwark and Vauxhall Companyの利用を止める解決策を導いた分析です。

f:id:gilles-nao:20201102174945j:plain

Snow, John (1855). On the Mode of Communication of Cholera (2nd ed.). London: John Churchill. 

(2017年11月20日にFacebookに投稿したテキストを再掲)

「誤差」に関する誤解

 私が大学院で数多くの学術論文を読むようになったばかりの頃、どの論文も分析の結果ごとに、しつこく「統計的有意」について言及していたことに、少々驚いたことを覚えている。

 それまで広告会社やコンサルティング会社で、統計的に意味のある数字となる目安となるサンプルサイズについては教えられており、そのサンプルサイズをある程度意識をして調査を設計してはいたのだが、正直に告白すると、「サンプルサイズをクリアしていれば、『その調査結果は信頼できないのでは』という、議論の本質とは異なるところで突っ込むことが好きな人にその他の参加者の方々が付き合わされる時間を排除できる」くらいの感覚で仕事をしていたような気がする。

 そして、学術論文を読み始めた頃は、まだ統計学について断片的な知識しかなったので、すべての分析の結果について、ひとつずつp値が記載されている論文を読みながら、これも正直に告白すると、「科学的な厳密性を問われる学者の世界は大変だなぁ、実務だと、そこまで厳密でなくても、意味合いが出ていればいいんだけどなぁ」と思っていたような気もする。

 統計についての体系的な話を、恩蔵直人先生の授業で学ぶまでは…。
 
 そんな過去を持つ私なので、実務で分析の結果に触れる方々の多くが、「誤差」についての議論が、どこか衒学的で、揚げ足とりな感じで、議論の本質とは関係がないもののように思っていらっしゃるんだろうなぁ、ということは理解している。

 しかしながら、「誤差」の話は、分析を実務の意思決定に使う際には、甘く見てはいけない。幸い、今の仕事の関係で、日本の一流企業の方々が行っていらっしゃる分析を拝見する機会に恵まれているのだが、拝見した分析の多くは、誤差によるノイズが大きすぎてそのままでは意思決定に使えないものだった。そのような分析において、誤差の問題を理解していないで意思決定に活用すると、効果がないものが効果があるように見誤ったり、ノイズを除去したら効果がマイナスだとわかるものをプラスに見誤ったり、ということがしばしば起こってしまう。

 この誤解をどう説明したら解消できるかなぁ、と思いながら、昔読んだ本のKindleのデータを旅行中にめくりなおしていたら…やはりこの本の説明がわかりやすい。
“ …単純なクロス集計から売上を増加させる可能性のある要因を明らかにし、またいくら売上が増加するのかといった額の試算も行ったが、これはあくまで皮算用だ。なぜなら、この計算が「誤差」というものをまったく考慮していないからである”
〔西内啓(2013)「統計学が最強の学問である」3章11節「p値5%以下を目指せ!」〕
 マーケティングや経営の分析に携わる方々の多くは、おそらく自らの仮説をクロス集計でざっくり検証し、その中で明確な傾向が見える結果をチャートにし、クライアントとの討議用資料に仕上げていらっしゃるだろう。そのクロス集計が、「あくまで皮算用」とは、穏やかな話ではない。どういうことなのだろうか。

 著者の西内氏は、自身が研修の講師をしたあるEC企業の事例を紹介している。
“ …こうした誤差を考えないクロス集計による皮算用、というのもビジネスの現場ではしばしば行われている。

 たとえば私が以前統計学の講師として招かれたEC企業では、積極的に「A/Bテスト」を行っている。クリックするバナーのサイズを変えたり、ページ間の画面遷移を変えたり、ページの文面やフォントを変えたり、といった細かいデザイン面や機能面の変更を行ううえで、「実際、どちらのデザインがよいのか」といった評価を検証しようというのだ(中略)

 多くの場合はユーザーのアクセスに対してランダムにAパターンとBパターンのサイトを開き、一定期間収集されたアクセスログをもとにAパターンとBパターンの比較を行うことになる(ランダムに表示を分けることがむずかしい場合、1週間など決まった期間ごとに表示を変えるという場合もある。)

 比較されるのはたいていバナークリック率や商品の売上、有料会員への入会率といった利益に直結する数字についてであり、AパターンとBパターンのどちらが優れていたかという判断のもと、その後優れていたパターンがサイトに正式に採用されるのだ(中略)  …そのEC企業は力を入れて毎月のように細かいA/Bテストを行っていた。コンマ数%のコンバージョン(購買率)の違いは年間にして億単位の売上に繋がると考えられたのだから、専任のチームを編成し、これまでの傾向から新たな改善パターンを考え続ける、というのは素晴らしい戦略である。

 コンバージョンの上がる改善案を出したスタッフは定例のミーティングの中で賞賛され、実際に部署全体が祝福ムードに包まれていたそうである。データを経営に活かす姿勢として彼らの取り組みは素晴らしいものだ。

 しかしながら、ここで落とし穴となるのが、彼らが誤差のことを考えていなかったという点である(中略)

 …サイト訪問者に対して、ランダムに既存のAパターンと改善したBパターンをそれぞれ10万人ずつに対して見せたログを分析した結果、既存パターンでは購買率が9.5%であったのに対し、デザインを改善した結果9.6%に伸びたというのである。

 前節の考え方に則れば、こうした新しいデザインを採用するだけで売上は約1.01倍(=9.6%÷9.5%)に伸びるという可能性が示されたということである。つまりもし彼らに現在10億円の売上があったとすれば約1,000万円、もし100億円の売上があったとすれば約1億円分の売上増加が見込まれるということだ。しかも何か特別の投資を行うわけではなく、単にページの細かいデザインを変更しただけで、である。これなら確かに祝福ムードに包まれるのも不思議ではない。

 だが残念なことに、この差が意味のある差なのか、それとも誤差なのかはよくわからないのだ(中略)

 …A/Bテストの結果に対してその場でカイ二乗検定を行ってみると、「実際には何の差もない状況でもデータの誤差によってこの程度(10万人中100人またはそれ以上)の差が生じる確率は44.7%である」という結果が示された。

 この「実際には何の差もないのに誤差や偶然によってたまたまデータのような差(正確にはそれ以上に極端な差を含む)が生じる確率」のことを統計学の専門用語でp値という。  このp値が小さければ(慣例的には5%以下)、それに基づいて科学者たちは「この結果は偶然得られたとは考えにくい」と判断するというわけである。

 5%以下であるべきp値が44.7%であるとは、つまり、彼女たちがデザインを褒めたり、チームで祝福していたりした結果が、真に今後何億円もの売上を約束するかどうかはまったくわからない、ということだ。

 彼女たちが行っていたことは、いわば、誰かがコインを1回投げて表が出たというだけで「すごい!表が出続ける魔法のコインが見つかった!」とか、「すごい!この人はコインで表を出し続ける必勝法を身につけた!」と喜んでいる状態とまったく変わらないのだ。

 本当に意味があったのかなかったのか、よくわからないまま定期的な改善を重ねて一喜一憂していても、彼女たちの仕事が利益に繋がっているのかはやはりよくわからない”

〔西内啓(2013)「統計学が最強の学問である」3章11節「p値5%以下を目指せ!」〕 

 西内氏が挙げているこの事例は、この分析の結果を「何か特別の投資を行うわけではなく、単にページの細かいデザインを変更しただけ」の意思決定に活用しているだけなので、まだ被害は、もし気づいていないマイナスの効果がなかったならば大きな問題にはならないだろう

 しかしながら、これが、数十億円の金額の投資を伴ったり、大がかりな組織的な調整が求められる施策の意思決定だったらどうだろうか?

 前者ならば、効果がないものや、逆効果を生み出しているものに数十億円の金額を注ぎ込んでいることとなり、後者ならば、仮にしばらく経ってどうやら意思決定が間違っていたらしいことに気がついても、そこから軌道修正をするのに再び大がかりな組織的な調整が求められ、そのプロセスの中で、社内には経営の意思決定に対する不信感が刻まれることになるだろう。

 分析の結果を、新たな解決のアプローチを探索するのに使うときには、「筋のよい仮説」とクロス集計が有益だが、仮にその分析の結果を意思決定に使うとするならば、ぜひ「誤差」について理解をされてから活用することをお勧めします。

(2015年12月19日に
Facebookに投稿したテキストを再掲)

内部妥当性と外部妥当性

学術研究やビジネスにおいて、ある要因(統計学では「独立変数」と呼ぶ)とそれがもたらす結果(統計学では「従属変数」と呼ぶ)の間に因果関係があるかどうかを、実験(例: ランダム化比較試験、非ランダム化比較試験、自然実験)に基づいて分析することがある。このような分析においては、無作為抽出と無作為配分が鍵となる。 統計学の概論を解説した教科書ならば、そのどこかには、おそらく、「無作為抽出」について書いてあるだろう。たとえば次のような記述だ。
「統計的検定を行うためには、サンプルは母集団から無作為に抽出しなければならない」
その一方で、統計の教科書にはなぜかたまに載っていなかったりするのだが「ある意味では、無作為抽出よりも、はるかに重要な手続き」とも言われている(1)「無作為配分」という概念がある。
「個々の科学的探究で使われる無作為配分は、ある意味では、無作為抽出よりも、はるかに重要な手続きだといってもよいのかもしれない。にもかかわわらず、統計学の教科書では、ふつう『全有権者』のような具体的な母集団からの無作為抽出だけが解説してあって、そのあとすぐに、統計的検定の話になってしまう。無作為配分の解説がのっている例は、ほとんどないのではないだろうか。そのため、『無作為抽出を行わない実験では、無作為配分が、統計的検定を正しく行うための必須の前提となる』という重要な事実がよく理解されずに終わってしまい、無作為配分なしの誤った統計的検定が横行する結果になっているのである」 (佐伯胖・松原望編「実践としての統計学」東京大学出版会 140p.)
一見似ているので混同されやすい「無作為抽出」と「無作為配分」は、それぞれいったい何の話をしているのだろうか。この話を整理するには、まず、「内部妥当性」と「外部妥当性」の話から始めるとよさそうだ。
たとえば全部で10,000の店舗を持つコンビニエンスストアが、一部の店舗で「ワインコーナー」を拡充する実験を30店舗で行い。それに基づいて全国展開をするかどうかを判断しようとしたとしよう。「ワインコーナー」設置の初期コストを6ヶ月で回収できる+1.0%以上の粗利益の向上を目標として実験を行い、実験の結果、粗利益が平均+5.0%向上したならば、「ワインコーナー」を残りの全店舗に展開すると判断してもよいのだろうか。
この問いに対して、統計学の観点からは二つの論点がある。一つ目は「その30店舗で確認された5.0%の粗利益の向上は本当なのか」という点、二つ目は「その30店舗で確認された5.0%の粗利益の向上は、他の店舗においても同様の効果がありそうか」という点である。
前者は、実験の結果が現実を正しく反映しているか(これが「内部妥当性」)に関する議論であり、後者は、実験の結果を一般化できるか(これが「外部妥当性」)に関する議論である。

まず、内的妥当性=実験の結果が現実を正しく反映しているかについてもう少し見てみよう。

先ほどのコンビニエンスストアの「ワインコーナー」を拡充する実験を例に使うならば、「ワインコーナー」の拡充といった要因(独立変数)と粗利益の変化のような結果(従属変数)の間に因果関係があれば、内部妥当性があるということになる。
しかしながら、実験においては、独立変数と従属変数の間の因果関係が本当はないのにあるように見誤らせる、あるいは、本当はあるのにないように見誤らせる、独立変数以外の変数(統計学では「ノイズ」あるいは「干渉変数」と呼ぶ)が存在する。

ノイズがあると、実験をした30店舗(統計学においては「テスト・グループ」あるいは「実験群」という)の個々の店舗において、観測される従属変数の値が、真の値(独立変数が従属変数にもたらす真の影響の値)よりも、プラスの方向もしくはマイナスの方向にずれてしまう。 たとえば、テスト・グループにはたまたま東京都港区に立地している店舗が多く含まれていたが、その30店舗と比較する基準となる店舗(統計学においては「コントロール・グループ」あるいは「対照群」という)が全国から平均的に選ばれていたならば、「ワインコーナー」の拡充の効果だと思ったものが、実はテスト・グループとコントロール・グループの間の人口動態の違いというノイズによってもたらされていたのかもしれない。

この問題を解決するためのアプローチのひとつが無作為配分である。サンプルをテスト・グループとコントロール・グループの間に配分する、あるいは、複数のテスト・グループ間に配分する際に、無作為に配分すれば、個々のグループの間でサンプルを等質にすることができ、それによって、グループの間でノイズがもたらす影響を乖離の幅を小さくすることができる。

ただし、テスト・グループのサンプルサイズが制約される実務における実験においては、無作為配分によっても、ノイズがもたらす影響の乖離の幅を、意思決定に求められる精度のレベルまで抑えることができないことがしばしばある。サンプルのサイズが少ないと、プラスの方向へのずれとマイナスの方向へのずれが、同じように現れて相殺する効果(統計学において「平均への回帰」という)が十分に期待できないからだ。 この問題を解決するアプローチのひとつが、たとえば、私が今携わっているAPT (Applied Predictive Technologies)が採っているような、テスト・グループとコントロール・グループの間のマッチングにアルゴリズムを活用するものである。

次に、外部妥当性=実験の結果を一般化できるかについてもう少し見てみよう。

先ほどのコンビニエンスストアの「ワインコーナー」を拡充する実験を例に使うならば、実験をした30店舗(統計学においては「テスト・グループ」あるいは「実験群」という)が、全店舗の特徴をどれくらい代表しているものなのかが鍵となる。

たとえば、実験をした30店舗のうち28店舗が、たまたま東京都港区に立地している店舗だったとするならばどうだろうか。仮に粗利益が平均+5.0%向上したという結果が、ノイズがもたらす影響を抑えることによって得られた真の値だったとしても、他の地域で同じように粗利益が向上するかどうかに疑問の余地が残る。

この場合、外部妥当性に問題があることになる。 外部妥当性の問題を解決するためのアプローチのひとつが無作為抽出である。

母集団からサンプルを選ぶ際に、無作為に抽出すれば、サンプルでわかったことが、どの程度母集団にあてはまるかを、推計学的手法を用いて、確率的に推定することができる。

ちなみに、10,000の店舗を持つコンビニエンスストアが、30店舗の実験において、実験した店鋪の80%にあたる24店舗において+1.0%以上の粗利益の向上の目標をクリアしていることが観測され、観測された値が仮に真の値だとするならば、全店舗で展開した場合、+1.0%以上の粗利益の向上の目標をクリアする店鋪の割合は、95%の確率で全店舗の65.4%〜94.9%に収まることとなる(2)。


「外部妥当性があるか」に関する問い、たとえば「無作為抽出によって、サンプルが母集団の特徴を偏りなく正確に反映している(統計学ではこの状態を「代表性がある」という)実験ができているか」という問いについては、直感的にわかりやすい概念のためか、ビジネスの現場で分析に慣れている人々にとっても比較的関心が高い。

その一方で、「内部妥当性があるか」に関する問い、たとえば「無作為配分などによって、ノイズの影響が十分に抑えられているか」については、直感的に少々わかりにくい概念のためか、ビジネスの現場で分析に慣れている人々においても、意外と重視されていない場面をしばしば拝見する。

科学においては、内部妥当性と外部妥当性の優先順位は逆のようだ。

実験に制約がある中で、実践的に問題を解決しようとするならば、まず内部妥当性を無作為配分などによって担保し、統計的検定によって確認した上で、次に外部妥当性について、実験を積み重ねながら、段階的に精緻化していくというアプローチの方が一般的である。

テスト・グループを選ぶときに、できるだけサンプルに偏りが入らず、代表性を担保するよう努力を続けることはもちろん必要なのだが、ならば無作為抽出のサンプル以外は全く意思決定に使えないかというと、それは極論であろう。

たとえば疫学や心理学の実験のように、サンプルのサイズや倫理的な制約から無作為抽出が難しく、外部妥当性の担保が難しい領域においては、まずは偏ったサンプルの中からでも内部妥当性によって独立変数と従属変数の間の法則を発見し、発見した法則の中で重要なものについて、よりサンプルの偏りを抑えた実験を徐々に追加しながら外部妥当性を確認していくといったアプローチが採られており、それによって数多くの課題が実際に解決されている。
「...統計的検定の前提は無作為抽出だけではないのである。無作為抽出を行っていなくても、無作為配分を行っていれば、検定は十分に意味のあるものになる。検定の結果にもとづいた結論も、やはり意味のあるものになる」 (佐伯胖・松原望編「実践としての統計学」東京大学出版会 140p.) 無作為抽出ばかり強調する前に、限られたサンプルの中からでも、まずは内部妥当性を担保しながら法則(例:効果が高そうな施策は何か、それはどのようなメカニズムで効果につながっていそうか)をまずきちんと学び、そのような学びをもとに、徐々に実験と分析を重ね、外部妥当性を確認していくアプローチが、科学においてばかりでなく、ビジネスにおいても、実践的なアプローチではないだろうか。

(2016年3月13日にFacebookに投稿したテキストを再掲)
  1. 佐伯胖・松原望編「実践としての統計学」(東京大学出版会)140p.
  2. 標準誤差の公式によると、母集団が10,000件、サンプル数が30件、真の値が含まれている割合が80%の場合、標準誤差は7.3%となり、 80%-(標準誤差×2)~80%+(標準誤差×2)に真の値が含まれている確率が95%となる。ちなみに、サンプル数を2倍(60件)にした場合は標準誤差が4.9%となり、70.2%~89.8%に真の値が含まれている確率が95%となる

モーリス・メルロ=ポンティと安宅和人

今から三ヶ月ほど前に 安宅 和人さんの論考「知性の核心は知覚にある」が掲載されたDIAMONDハーバード・ビジネス・レビューが自宅に届き、それからしばらくして、この論考について熱く語られたコメントが私のfacebookのタイムラインに現れるようになりました。
当時、たまたま締切直前の準備作業のため、ざっと拝読したときに、もちろんタイトルが似ているのもあるのですが、その内容からも、私が大学時代に履修していた木田元先生の講義で聴いた、メルロ=ポンティの話を思い出しました。
当時の講義ノートや参考文献は残念ながら残っておらず、そしてそもそも当時の木田先生の講義は、学生に語りかけるのではなく、黒板に向かって板書しながら独り言をつぶやいているようなスタイルだったので、木田先生がおっしゃったことではなく、木田先生の授業に登場するメルロ=ポンティの話に影響されて私が考えた話と言った方が正しいのですが、確かこんな話だったかと思います。
  • 知覚という行為を、知覚する対象の側にあらかじめ客観的な真実があり、その真実を、知覚する主体である私たちが「読み取っている」という図式で捉えるのは必ずしも正しくない。 たとえば、「直径数センチのやや球体に近い物体」という情報が感覚器(たとえば視覚や触覚)から入ったときに、私たちが「これはりんごである」や「このりんごは赤い」といった意味を読み取るのは、その物体が視覚に入る前に、私たちに「りんご」や「赤い」といった概念があり、その概念に合致する特徴を持つものを、そうでないものと区別して意味を読み取ろうとする能動的な働きかけがあるからである。 「りんご」や「赤い」という概念がなければ、私たちはその物体に特に注意を払わず、それがぶらさがっている木の枝を見て「武器」という意味を読み取っていたかもしれない。
  • しかしながら、ならば私たちが持つ概念に真実があり、概念によって、知覚する対象をいかようにでも読み取ることができるかというと、それも違う。 私たちは、概念を組み合わせて、より抽象度の高い概念の連鎖、たとえばモデルやストーリーを構成する。そして、モデルやストーリーを持つことで、個々の知覚からもたらされる数多くの意味から、何に注目すべきかを見極めたり、その意味が示す複数の点の背景でどのような線がつながっているかを思い描いたりできるので、そのおかげで、私たちは、感覚器から入ってくる数多くの情報の処理に忙殺されずにすんでいる。 だからといって、そういったモデルやストーリーと整合性が高い意味を、感覚器に入ってくる情報にはありもしない特徴から無理やり見出そうとするのは、知覚が概念によって歪められている状態である。 たとえば、「前にこの木の枝に赤いリンゴがあり、それを食べたら空腹が満たされた」という記憶があったとしても、だからといって春のある日にお腹が空いたときにその木の枝に行って、「直径数センチのやや球体に近い物体」に、「前のように赤くはなく、形も少し違うか、これもきっと私の空腹を満たしてくれるリンゴだ」という意味を見いだすのは、知覚ではなく、概念(「この木の枝に来ればリンゴによって空腹が満たされる」というモデル)が、知覚の本来の働き(「これは木のコブである」という意味を読み取ることができたはずの働き)を歪めているからである。
  • 知覚する対象の中に真実があるのでも、知覚する主体の持つ概念を操る精神の中に真実があるのでもなく、主体(の精神)が対象に働きかけ、対象から主体(の精神)が学びとる双方向的で同時発生的な行為が、対象と主体(の精神)が出会う「身体」において発生している。これこそが知覚である。 たとえば、その木の枝の前に自らの身体を置き、「直径数センチのやや球体に近い物体」に対して自らの感覚器(+今日では「対象の全体と直接的に関わる状態を示すデータに基づいて分析されたデータ」もここに並ぶ)を制約なく開放し、その感覚器を通じて、多種多様な概念に基づいて対象に能動的に働きかけながら意味を読み取ることで、徐々に対象を見極め、学習を深めることができる。
私たちがあらかじめ概念を持ち、それに基づいて能動的に知覚する対象に働きかけないと、知覚する対象から意味を読み取ることはできないが、概念が相互に連鎖して立派なモデルやストーリーになると、今後はそのモデルやストーリーが先入観になってしまい、知覚する対象から正しく意味を読み取ることができなくなってしまう – ならば、まず知覚のメカニズムを解明してみよう、そこでポイントとなるのは、対象と精神が出会う「身体」で何が起こっているかというあたりのようだ、それが解明できれば、知覚がより優れた形で機能するように導く方法が見つかるかもしれない – これが、メルロ=ポンティが今から70年ほど前に「知覚の現象学」あたりで考えていたテーマだったのではないかと推察します。
このテーマは、人間の知的生産のプロセスの一部を代替する一連の情報技術 (例: ビッグデータ、機械学習、人工知能)が登場しつつあり、私たちの知的活動のあり方を見直すタイミングで、改めて注目すべきかと存じます。 安宅 和人さんは、モーリス・メルロ=ポンティが着手した「いかに知覚をより優れた形で機能するように導くか」というテーマの、正当な後継者ですよね。
…なんてコメントを、論考を拝読した直後に書こうと思っていたのですが、忙しさにかまけれタイミングを外してしまい、そのまま書けずにおりました。
そんな中で、先日、あるイタリア料理屋さんでばったり安宅さんとお目にかかり、それをきっかけに、この週末に、論考「知性の核心は知覚にある」を、もう一度拝読しました。 そこで再発見したのが、この論考のディテールの面白さと安宅さんの「親切さ」でした。
安宅さん自身がご専門の脳科学の研究から得られた知識や、経営戦略の問題解決の実践から得られた知恵、そして、一連の情報技術に対する本質的な理解に裏付けられたこの論考は、基本的なテーマとは別に、そこに登場するディテールが、それだけで別の論考も書けそうなくらい面白いです。脳科学の視点からの「理解」「記憶」の話や、課題解決の2つの型(「ギャップフィル型」と「ビジョン設定型」)の話などそれだけでもかなり面白かったです。
そして、知覚がより優れた形で機能するように導くためには、対象に対してファーストハンドな(≒対象物とできるだけ直接的に接触する)状態に主体が自らの「身体」を置き、主体から対象への働きかけと対象から主体が学び取る経験を積み重ねていくことによって、主体が対象に働きかけるときに使う概念や概念の連鎖の質を高め、幅を広げていくことが鍵となるのではないか、というのがこの論考の中核的な主張なのですが、よく読むと、単にこの主張を展開するだけでなく、読者がそれを実現するために何をどうしたらよいかを、多面的な切り口から具体的に示し、わかりやすく伝わるように工夫していることに気づきました。安宅さん、実は親切な方なんですよね。
というわけで、遅ればせながら、かつまとまりもありませんが、 安宅 和人さんの論考「知性の核心は知覚にある」の感想コメントでした。

(2017年7月9日にFacebookに投稿したテキストを再掲)