安本氏からのマルチコ批判に応える
|
はじめに─経緯など
私は、昭和43年秋頃から、井上光貞氏などの上古年代遡上案を踏まえつつ、活動年代が知られる古代天皇から、なんらかの形で年代遡上させて上古天皇の年代推定ができないだろうかと模索していた。そのなかで出てきたのは、「諸天皇一世代の在位年数」を用いて年代遡上するという先考たちの考えたものが基本であって、当時は複雑な計算が簡単にできなかった事情から、経験的帰納的に見て、推計対象の一世代を、「25年+二人以上の在位者数がいる場合には在位者数から1を差し引いた数(△1)×4年」で各々概数を計算して、これを積み上げて遡るような形で考えていた。 それが、拙著『古代氏族系譜集成』(1986年刊)や『「神武東征」の原像』(2006年刊。内容は変わらない新装版が2017年に刊行された)を出す頃には、コンピュータやPCの利用も可能となってきたので、これら手段により計算をやり直して、次のような形で相関式を考えた(Niには「0〜実態で見て5,6人」という幅があり〔一部にダミー変数を持ち入らざるを得ない時期もあり、それは調整した〕、「△1」のほうは係数が掛けられる定数計算のなかで入れられるから、簡明さを考えて、この相関式算出には用いなかった事情もある)。
Yi=174.7 +13.0Gi +7.8ΣNi 標準誤差:8.73 R2 :0.998
(この数式のGiは世代、Niのほうは在位者数を意味する。なお、基礎データの取り方により、次のような参考推定式もあるが、上記の式で代表させた。 Yi=175.4+13.9Gi
+6.8ΣNi 標準誤差:6.48 R2 :0.998 )
『「神武東征」の原像』で用いたのも上記の相関式である。この数式は、見るとおり、上古のある世代についてその在位期間を幅のあるものとして推定するものにすぎない。だから、個別天皇の具体的な在位期間は、『書紀』紀年の暦年判断など貝田禎造氏(『古代天皇長寿の謎』1985年刊)らの考え方を踏まえて別途算出しており、それとの符合性を見る役割を果たすものである(同書のp222,223にその成果として推定される数値の表を掲載している)。
ところが、最近(2017.7.23)、数理歴史学の専門家という安本美典氏が主宰の「邪馬台国の会」の講演で、上記の相関式を取り上げて批判、疑問提起をされたと聞き、その資料も届けられたので、この辺を再考するものである。
ちなみに、安本氏は、天皇の在位者数だけを変数に用いて、その平均在位年数で上古にまで遡上する計算を行い、これが統計的手法だと長年、喧伝してきた。しかし、この変数1つだけでは、推計数値にあまりにブレが大きく、不安定なのでこの関係の推計だけでは、とても数値採用が採用できない、しかも、推計の基礎となる安本氏のデータ選択にもいろいろ問題がある、と私は考えてきた。
このことや、拙考への批判についても、私が若い頃に経済企画庁において政府経済見通しの作業に二年間、従事した知見・経験からいっても肯けないものいくつかがある。そのため、改めて諸書を紐解き、経験者にも問い合わせた結果を記載するものである。
(なお、7/23当日における拙考へのご批判については、他にも多くあり、先ず問題提起を感謝するとともに、それら全てについて反論・説明が可能なので、対応をしたいと考えている。これについては、当HP内の 安本美典氏からの批判に対するお応え を参照されたい)) 安本氏からのマルチコ批判 要は、私が上記相関式で使用する@世代数、A各世代の在位者数(の累積)という変数の2つが「マルチコ」(多重共線性)を起こしているのだから、正しい推計ができない(拙考の推計式は無効で使用できない)、というのが安本氏からのマルチコ批判の主旨の模様である※。更に、多変数の場合には、Rが0.95以上だと、回帰分析には使えないとExcelの説明書に書いてあるのに、そんなことも知らないのか、と曰われる。 ※ 言葉の走りなのであろうが、「マルチコ」を分からない者や統計学関係の論文を発表していない者は、統計数理について発言するのは僭越だ、とまでとれることまでを安本氏は言われる。これは、言い過ぎであろう。
というのは、普通の説明書では、マルチコを「多重共線性」(multicollinearity)という語で表現するし、複数の変数を用いて回帰分析を行うに際して留意すべき内容は、当然、承知している。また、こんな単純な回帰分析は、統計的な基礎知識と応用である。今ではわりと使われる、こうした略称・通称の知識は、議論の問題にすらならないからである。
ところで、私が使用したデータの検証を安本氏がどのようにされ、Rの値が0.95以上だと何をもって確認されたのだろうか、上記趣旨のどこかに勘違いがあるのではないかとも思われた。
ここで、問題となる「多重共線性」について、各種の説明から要約して簡単に説明すると、概ね次のとおりである。
「多重共線性」とは、説明変数同士が強く相関しているケースで発生する問題で、その結果、X1、X2……にかかる係数(パラメーター)の標準誤差が大きくなり、その推定結果の正負(回帰係数の符号)も大きさも信頼のできないものとなってくる、t値が小さくなる、などの推計に悪影響が出ることだ、と解されている。重回帰分析を行う際に、総じて説明変数を増やすほど決定係数が高くなりやすいため、多くの説明変数を入れてしまう誘惑にかられがちであり、その際に留意しなければならないのが多重共線性の問題だとされる。
別の言い方では、次のような表現もインターネットに見える。 独立変数間に非常に強い相関があったり、一次従属な変数関係がある場合には、解析が不可能(「逆行列が求まりません」というエラーメッセージが出る)であったり、たとえ結果が求まったとしてもその信頼性は低い。このような場合に多重共線性がある、とされる。
「多重共線性」が問題になるときは、相関しているパラメーターのどれかに興味があるときだ、ともされる。
これらのことを逆にいえば、多重共線性が問題にならない時は、次の2点とされる。
@
相関をしている変数の効果を分析すること自体には意味がなく、ほかの変数のパラメーターに興味があるとき。
A 予測モデルを作っているときで(+パラメーターの解釈には、特に興味がないとき)、予測モデルの精度という観点では、多重共線性は大きな問題にならないとされる。
こうした事情から考えると、上古天皇の年代推定という本件のような予測モデルでは、多重共線性は大きな問題にならない、と一般的に言えよう。 ※安本氏は、その説明資料では、この種の説明(多重共線性の問題点、対応方法など)は、「「マルチコ」をキーワードとして検索すれば、インターネットに数多くのっている。」と記すが、多重共線性が問題にならない時も、インターネット上に掲載されており、それがすぐ出てくるにもかかわらず、まるで記載しない。これは、恣意的な除外ではないのだろうか。 安本氏の批判が当たらないこと 1 この問題に対しては、統計分析に長い期間、実際的に携わって、この方面の活動ではまだ現役である「知己」(東大経済学部で統計学を専門的に勉強・研究し、社会に出てからも経済分析の分野で実戦的に活躍してきており、現在まだ某大学経済研究所の研究員として活動する)に尋ねたところ、彼からのお答えは次のような趣旨であった。 @ マルチコの問題を回避するために、重回帰分析による推計に当たっては、相互に独立の動きをする複数の変数があることが望まれる。 A 相互に独立の変数を選んだ場合でも、趨勢的な動きを示す変数の間ではR(重相関)がかなり高い数値を示すことがありうるが、これら変数を用いた推計式とその結果が直ちに無効というわけではない。ときに、異常な推計数値を示すこともあるから、十分注意して用いることが必要だということである。変数の間のR(算出された推計式のRではない)が例えば0.95以上だと使えないという話は聞いていない。
趨勢的な動きを示す変数を排除しては、実際に経済予測的な作業はできないことすら考えられる(これは、上記のように、予測モデルでは、多重共線性は大きな問題にならないということにも通じる)。
B こうした相関の推計式を推計本体におくのではなく、別途のやり方で求められた推計値があって、そのチェック的な役割に用いるのはなんら構わない。
2 これを踏まえて、具体的に拙案の推計式を見ると、X1(世代数)とX2(各世代の在位者数の集積)は相互に完全に独立した動きを示す変数であることは疑いない。X1の係数は20年くらいで、X1自体は1世代ごとに1が増えるが、一方、X2の係数に関係する各世代の在位者数は、現実には「0〜5,6」くらいの範囲の数値であって(現実に0の場合もあり、多くは2程度であろうが、「在位者数−1」という数字に置き換えて、各世代数の増加1に対処したとしても、これに定数の係数が掛けられるだけである)、その集積(Σ)がX2となる。
※天皇の世代数(X1)と在位者数(X2)とが独立変数とは言えず、「雨が降った日数」と「月間の降雨量」のような関係に近いとみられると安本氏が評価するが、世代数が増えても在位者数が増えない場合もあり、世代数が少し増える場合でも在位者数が大幅に増えることもあって、降雨日数と降雨量との関係とみるのは、強引すぎる。 現実に上記相関式におけるX1とX2とは、それぞれあまり大きな動きを示さないこともあって、しかも趨勢的なものだから、Rが1に割合近い可能性もあるが、Excel等により推計式が算出される場合には、上記の注意を踏まえて扱えば、使用することについてはとくに問題がないと判断される。
ちなみに、世代数だけ、在位者数だけのごく単純な一元一次の推計式も算出可能であるから、これらと併せ用いる方法もあるかもしれない。変数を2つ用いるのは、推計が粗くなるのを別の変数を加えることで調整する意味(それぞれの在位者数の相違を反映させて、より現実的な推計にする意味)がある。
また、拙見の上古天皇の在位年代は、別途、『書紀』の紀年記事等に基づいて推定されており、これを本体としている。かつ、『書紀』の太歳干支なども参考にしているから、相関推計式がすべてを説明しているわけでもない。
以上の諸事情から言って、安本氏から拙論に対するマルチコ批判は当たらないと結論される(こうして見ていくと、安本氏が実践的に数値予測をどの程度行ってきたのか、マルチコ自体の意味と問題点を的確に理解しているのだろうか、という疑問すら生じてこよう)。
(2017.8.25掲上)
邪馬台国の会に関連する諸問題 の総括頁へ 関連して 邪馬台国東遷はなかった ─安本美典氏の邪馬台国論批判─ もご覧下さい。 |
日本古代史一般の目次へ |