第17話 ハーバー・ボッシュ法の後日談

文字数 7,472文字

(ハーバー・ボッシュ法は、データサイエンスに繋がっています)


1)観察研究

肥料が発見される前には、収量の多い作物と収量の少ない作物を観察して、原因を考える「観察研究」が手法として採用されています。

「観察研究」は、仮説を立てる取り掛かりとしては、現在でも使われます。

しかし、この研究手法ははずれが非常に多いことが分っています。

例えば、作物の収量を考えれば、品種、日射、気温、水分、排水、風、肥料成分、病害虫、連作などが収量に影響します。

これだけ影響する要素が多いと、観察で、正しい解説を導くことはほぼ不可能です。

無理をして仮説をつくれば、その仮説はほぼはずれになります。

2)フィッシャーの実験計画

ハーバー・ボッシュ法は、窒素肥料を安価に製造する方法です。

まず、窒素の他に、リンとカリウムが、作物栽培に必要な元素であることがわかります。

その先には、さらに、微量の元素が検討されます。

こうした作物科学では、肥料を使った栽培と使わない栽培が比較されます。

一般には、with-without法と呼ばれる比較手法です。

栽培区間を準備して、with-without以外の条件を揃えた実験を行います。

統計学者のフィッシャーは、農業試験場で、作物の収量に影響を与える要素の研究を行っていました。

しかし、フィッシャーは、農業試験場で困難に直面します。

それは、フィールドでは、with-without以外の条件を揃えた実験は不可能であるという事実です。

ガリレオ以降の科学の進歩を可能にした手法は、特定の条件だけを変化させ、それ以外の条件を揃えた実験によって支えられていました。

物理学と化学では、この手法は、有効でした。

対象が生物や生態系になると、実験手法は失敗します。

それは、with-without以外の条件を揃えた実験が不可能なためです。

肥料の効果を検証するには、畑の区画を肥料を投与するwith区画と肥料を投与しないwithout区画に分けます。

この2種類の区画で、肥料以外の条件を揃えることになります。

2種類の区画に苗を植えます。

そのときに、植物の苗には2つとして全く同じ苗はありません。

排水条件や日照も出来るだけ揃えますが、実験室の試験管の中のように、完全に揃えることはできません。

試験管の温度は、温度調整機能付きのヒーターで一定にできますが、フィールドの区画の温度は、風まかせで、完全に揃えることはできません。

フィッシャーは、実験条件を完全に制御できない場合に、with-withoutの効果だけを抽出する方法を探しました。

その結果、フィッシャーは、ランダム化比較試験(RCT、randomized controlled trial)のアイデアにたどり着きます。実験条件を完全に制御できないのであれば、with-without条件以外の条件の変動を前提として、その変動をランダム化できれば、問題はないという手法です。


3)RCTとEBM

フィッシャーはRCTの手法を100年前の1920年代に思いついています。

RCTが広く使われるようになったのは、G・M・コックスとW・G・コクランが1950年に書いた教科書に、この手法を取り上げてからです。

農業以外の最初のRCTは、1948年のストレプトマイシンの効果です。
米国では、1962年のRCTが薬の承認プロセスに導入されています。

1990年代には、RCTを使った根拠に基づく医療(EBM)の基本的な手法になっています。

社会科学にRCTが使われるようになったのは2000年以降です。


RCTは非常にコストがかかります。そこで、疫学では、RCTに準ずる方法が採用されています。

コホート研究(cohort study)は、特定の要因に曝露した集団と曝露していない集団を一定期間追跡し、研究対象となる疾病の発生率を比較します。要因対照研究(factor-control study)とも呼ばれます。

症例対照研究(case-control study)は、疾病に罹患した集団と罹患していない集団を対象に、曝露要因を観察調査して、比較することで、要因と疾病の関連を評価します。ケースコントロール研究、患者対照研究、結果対照研究とも呼ばれます。

症例報告は、単一のケーススタディです。

信頼性は、「RCT> コホート研究>症例対照研究>症例報告」の順になります。

コホート研究、症例対照研究も、研究対象に介入しない観察研究に分類されます。

コホート研究は、観察研究ですが、大規模なデータを取り扱います。


4)研究デザインの登場

1990年からは診療ガイドライン(Medical guideline)が使われています。

ガイドラインは、研究デザインを表1のように分類しています。

表1 研究デザインによる分類

I a 系統的レビュー・メタアナリシス
I b ランダム化比較試験
II a 非ランダム化比較試験
II b その他の準実験的研究
III 非実験的記述的研究 (比較研究、相関研究、症例対照研究など)
IV 専門科委員会や権威者の意見

研究デザインによる分類のことを、エビデンスレベルやレベルとも呼びます。若い番号ほど科学的根拠が強いとされます。

コホート研究、症例対照研究、症例報告は、「III 非実験的記述的研究 」に区分されます。

Iaは最も科学的根拠が強い結果で、複数のランダム化試験の結果を系統的にレビューしたものです。
官僚は、なにか問題があると有識者会議に問題を丸投げしますが、有識者会議
( IV 専門科委員会や権威者の意見)は最も、科学的根拠がなくあてにならない(間違いが多い)研究デザインです。

これは、有識者会議が無効であるという意味ではなく、有識者の意見を聞くよりも、有識者のアドバイスのもとで、より信頼性の高い 研究デザインを実施すべきであることを意味します。

「II a 非ランダム化比較試験」と「II b その他の準実験的研究」は、今世紀に入って、手法が改善されています。WEBを使った調査、ABテストなどは、ここに属します。

統計的因果モデルも、このあたりで使うことが出来ます。

RCTが有効なことは確かなのですが、ランダム化した実験が可能でない場合の方が、可能な場合より多いため、RCTの利用は限定的になります。

この問題を回避するために、完全なランダム化は諦めて、若干のバイアスが残っている条件での解析方法が、開発されています。条件を揃えた実験が不可能な場合には、何らか介入(準実験)を使います。

介入も不可能な場合には、ビッグデータを使った「III 非実験的記述的研究 」を行います。

日銀が異次元金融緩和を行った場合には、金利に介入していますので、 II b その他の準実験的研究」が出来ます。

その研究結果に基づいて、経済政策を進めることが、有識者会議や、専門委員、審議会の答申を用いるより、より科学的で、間違いが少ないことを、表1は示しています。

つまり、専門家の意見は聞くが、より有効な研究デザインに着手しないことが、科学的に間違っていて、科学的文化のリテラシーが欠如していることを示しています。

5)「研究デザインによる分類」とパラダイムシフト

「研究デザインによる分類」では、専門家の意見は、最下位にランクされています。
専門家の意見の多くは間違いで、エビデンス、出来れば、RCTの基づくエビデンスの方がより正しいことを意味します。

学術会議の活動が活発でないという批判があります。しかし、専門家の意見はあてになりません。あてにならない(恐らく多くは間違いの)意見を流布されても困ります。学術会議の活動が活発でないことには、合理性があります。

更に、「研究デザインによる分類」を謙虚に読めば、ビッグデータがあれば、学術会議は要らないことになります。学術会議を廃止して、ビッグデータ整備会議を作る方が、科学的には合理的になります。

注意して頂きたいのは、この科学の変化は「研究デザインによる分類」が出てきた1990年以降に起きていることです。2009年のマイクロソフトのグレイによる第4のパラダイムの提案は、データサイエンス(つまり、「研究デザインによる分類」の視点)が、科学技術に決定的な影響を与えるようになったことを示しています。

「研究デザインによる分類」は、1990年以前の学術会議の歴史的役割を否定している訳ではありません。

1990年以前には、「研究デザインによる分類」に準じたデータサイエンスの手法は、実用化していませんでした。

その時には、専門家の意見を聞くことが、問題解決へのベストなアプローチでした。

しかし、2023年現在では、「研究デザインによる分類」は、実用に供されています。

2009年にマイクロソフトのグレイは、第4のパラダイムを提案して、自然科学のパラダイムシフト(あるいはレジームシフト)が起こったと主張しました。

2009年には、データサイエンスというパラダイムは、否定できない影響を及ぼしています。これは、デジタル社会へのレジームシフトの原動力(ドライビングフォース)です。

「学術会議を廃止して、ビッグデータ整備会議を作る」と書けば、悪い冗談のように思われるかも知れません。

しかし、ビッグテックなどのデジタル産業が大きな利益率をあげられる原因は、データサイエンスを使って合理的な経営をしているためです。

経営には、試験問題の答えのような正解はありません。このため1990年以前は、専門家の意見を参考にしていました。

現在、デジタル産業は、「研究デザインによる分類」に準じて、正しい答えに到達する確率のより高い戦略をとっています。専門家の意見は聞かずに、ABテストを多用しています。

情況証拠だけで、検証されていませんが、1990年以降、OECDの中で、日本経済だけが停滞した理由のひとつは、日本だけが、科学パラダイムシフトとそれにともなうデジタル社会へのレジームシフトを無視して、経験科学に固執したためと思われます。

アカデミック社会を科学パラダイムシフトに対応させて、バージョンアップさせるべきだと考えれば、今の経験科学中心の学術会議を残すより、ビッグデータ整備会議に再編する方が、はるかに合理的で、日本経済の成長に寄与します。

科学パラダイムシフトに対応しないで、日本だけが取り残されることに恐怖を感じないとすれば、その人は洗脳されていると思います。

こうしたレジームシフトを前提した社会システムの見直しの議論が、出てこないと、科学技術は先に進めません。


6)第4のパラダイム

マイクロソフトのグレイは、2009年に、科学の第4のパラダイムとして、データサイエンスを提唱しました。それには、ビッグテータの活用もありますが、研究デザインの方法論が整理されてきた点が大きく寄与しています。

グレイの分類では、第1の科学パラダイムは、経験です。これは、経験科学と呼ばれることもありますが、検証手順がないので、科学ではありません。

第2の科学パラダイムは理論科学です。これは、微分法方程式などの数式で、理論を記述します。

この理論をコンピュータで数値的に解く手法が第3のパラダイムの計算科学です。

理論科学と計算科学の主な部分は確定論で出来ています。

これとは逆に、主な部分を確率現象と見なして、モデル化する手法が、データサイエンスです。

データサイエンスのモデルは、統計的なモデルで、限られた母集団にしか当てはまりません。

ニュートン力学が成功をおさめた後では、科学者を、真理を追究ミッションを持っている人と考えられました。

前世紀には、未来永劫に変わらない科学的真理を追求するのが科学者だと考えられていました。

データサイエンスの世界観は、全く異なります。

理論はアプリオリに想定される真理に基づくのではなく、データに基づきます。

例えば、過去5年のヒットチャートの曲を分析すると、ヒットしやすい曲の特徴がわかり、これから発表する新曲がヒットする確率を計算するモデルを作ることができます。

次に新曲を売り出すときに、このモデルを使って新曲の評価を行い、ヒット確率が低い曲は、作曲家に書き直してもらうことで、ヒットしない外れを減らすことができます。

しかし、このモデルは、5年間のデータで出来ています。モデルが出来てから2年もすると、ヒットする楽曲の傾向が変化し、モデルの推定精度が落ちてしまいます。

その場合には、データを最新のものに入れ変えて、再度モデルに学習をさせるか、モデル構造を見直すことになります。

このようにデータサイエンスのモデルには、モデルが使える母集団のデータとセットです。賞味期限もあります。

データサイエンティストは、真理や本質には関心がありません。関心がある点は、どうすれば上手くデータと折り合いをつけて付き合えるかといことです。

ヒットする楽曲のモデルは、時間と共に変化します。モデルは、定常ではありません。データはノイズまみれで、データ数は不十分です。なので、入手できるデータ範囲で、最適な推定を行うことしかできません。真理にこだわっても始まりません。

これは日常生活のセンスとは異質で、トレーニングをつまずに、理解できません。

なお、大学の文系の学科だけでなく、理系の学科でも、科学の4つのパラダイムや、データサイエンスを理解できず、非科学的な研究手法が用いられている場合も多くあります。

そうした分野では、経験科学は科学であるとか、観察研究は科学であるといったデータサイエンスでは否定された主張が横行しています。

エビデンスを重視するデータサイエンスに基づかない研究成果は、それがレビューを通っていても、データの欠測と間違いが多すぎて使い物になりません。

例を上げておきます。

レッドデータブックに載っている貴重種が見つかったという観察研究があったとします。問題は、そこにいた種が、今後も生息できるか、絶滅するかです。それを判定するためには、生息環境の温度、水質、餌などのデータが同時に計測されている必要があります。食物連鎖で考えれば、捕食者の存在も重要です。

表1の研究デザインによる分類で取り上げられた、「 III 非実験的記述的研究」は観察研究ですが、必要なオブジェクトの属性を全て観察していることが前提になっています。それが、絶滅する個体と、生存する個体の違いを判別できる観察研究です。

つまり、観察研究と言えども、将来のRCTを睨んだ研究デザインになっています。観察研究という独立した研究手法はありません。

7)事実は意見に優る

最後に洗脳について考えます。

例をあげます。

中国が、領海侵犯をしたという報道があります。

この時の事実(エビデンス)は、どの船が、何時から何時まで、領海のどの部分に侵入したかということでです。

雲が少なければ、これは、衛星画像データを解析すれば、確認できます。

ところが、領海侵犯の報道では、エビデンスは報道されません。

日本政府の担当部署が、領海侵犯があったと中国政府に抗議した内容とそれに対する中国政府の返答が提示されるだけです。

別の例をあげます。

ウクライナとロシアが戦争をしています。

この報道は、ウクライナ政府とロシアの政府の見解だけです。

両国政府は、都合の悪い内容を報道することはありませんので、双方の見解とも、エビデンスに対して大きなバイアスがかかっています。

つまり、戦争のマスコミ報道には、エビデンスが含まれていません。


マスコミは、問題があると常に、 「 IV 権威者の意見」を載せますが、その大半は間違っています。とくに、判断の根拠となるエビデンス(データ)がない場合には、良識ある専門家は、データがないので、判断できないと答えるはずです。

しかし、それでは、記事や番組にならないということで、口からでまかせをいう専門家が重宝されます。専門家も、マスコミに出て売名をすることだけを考えている人もいます。
科学的文化は消滅して、占いのような人文的文化だけが動き回っています。

毎日、マスコミの報道を見ていると、意見だけを聞いて、エビデンスを確認しなことに疑問を持たなくなります。

「研究デザインによる分類」で、最低ランクに位置する専門家の意見を聞いて、それに、従えば、問題解決ができるという科学的に否定されているアイデアに洗脳されてしまいます。

回転寿司で、食品を舐めたようなユアチューバが問題になっています。

食品を舐めた動画は、汚い、不衛生とっ言った感覚に強く訴えるので、見る人が多くなります。

ビューを稼ぐユアチューバでは、感覚に訴える動画を作成する人も多くなります。

危険な高所での動画は、高所恐怖の人には、強いインパクトがあります。

マスコミに人気の専門家も、感情に訴えて、注目を集める戦略を採用しています。

こうして視聴者は、エビデンスの不在が気にならなくなる洗脳を毎日受けています。

なお、「感覚に強く訴える」という技法には、問題が多いのですが、これを排除することは(特に、人道問題では)難しいです。

FAOは食料援助のために、飢餓に悩んでいる子供の写真をつかっています。

無償食料援助は、緊急避難としては、やむを得ない面もありますが、継続すれば、産業としての農業を破壊してしまいます。また、援助は、ピンハネによる利権に結びつきます。

ウクライナでは、援助金で調達する食料や資材価格が、1年で3倍になったという事例も報告されています。物価が変動するので、真相はわからない部分もありますが、仮に、物価変動がないと仮定すれば、1年で、ピンハネする部分が援助金額の3分の2までに膨れ上がったことになります。

戦争になると、命の危険を冒してまで、援助金が適性に使用されたかをチェックする人はいませんので、真相はわかりません。

過去の経験からすると、フィードバックが効かない無償援助は、利権の塊になって、本来の産業活動を阻害するということです。

これは、海外援助だけでなく、国内のコロナウィルス対策にも共通して当てはまる原則です。

最近は、国内でも、コロナ対策で、巨額の補助金が動きましたので、同じ疑惑があります。

無償援助は、発展途上国以外では考えられませんので、同様の補助金が拡大していることは、日本が発展途上国である証拠と考えます。
ワンクリックで応援できます。
(ログインが必要です)

登場人物紹介

登場人物はありません

ビューワー設定

文字サイズ
  • 特大
背景色
  • 生成り
  • 水色
フォント
  • 明朝
  • ゴシック
組み方向
  • 横組み
  • 縦組み