ここから本文です
  • 1

    *****

    空いていたので■が入るならと作ってみた。

    独り言、世迷い事、好きに書いてくれ。

    書き込む内容に限定なし。
    資格はタイガースファンであるということだけ。

  • <<
  • 10479 10460
  • >>
  • 10479(最新)

    Toratorausa 2月18日 22:24

    >>10477

    >HR数やその飛距離等は参考になるかもしれません。

    一つ思いついたのが、HRと2塁打の比率です。

    2塁打は、飛距離の足りないHRと、内野手の間を球足速く抜けるタイプとにわかれないでしょうか?

    フライタイプの打者なら、大量の打者を処理すると、HR/2Bがある一定値の周囲に2項分布するようになるのが、ゴロタイプは、HR/2Bの値が小さくなり、両者がはっきりと乖離した分布に分かれるのでは・・・・

    少し遊べそうです。

  • V3さん、こんばんは。

    別カテで書きましたが、今旅の空。
    会合が、土曜日だったので、実質今週はウィークエンドがありません。
    とはいえ、久しぶりに昔住んでいた土地を訪れるのは、悪くありません。
    ホテルの前が港で、海風を浴びて歩いているだけで心が弾みます。

    タイガース歴代の有名打者の全盛期のデータ、ウェブからエクセルにダウンロードは済ませているのですが、これを標準化(スタッツは、百分率もあれば数値もあるので、すべてをいったん ‐1.00~+1.00の幅を持つ正規分布化したうえで多変数解析に掛けないと、「比重」がついてしまいます。この辺りは、プログラマーであり、数値処理の経験も多いV3さんにはナチュラルに理解できると思います)した上で、多変数相関解析に持ち込むので、小一時間ほどまとまった時間が必要ですし、どうしても落ち着いてデスクトップで処理したいので、着手できず遅れています。

    見た目の物理的な印象を裏切るような相似性が見つかるのではと、個人的にも興味が大きいのですが。
    月曜の午後にでも時間が作るか・・・

    V3さんの周囲も相変わらずフリータイムの少ない状況に見えますが、健康にご留意ください。

  • >>10473

    USAさん、こんばんは。
    まとめての返信になる事をお許しください。

    >良いところをついてこられますね。
    実は、今回は、「黎明期」のデータを使いました。

    いや、現役時代大好きだった藤田氏の成績に違和感があったので。
    なるほど飛躍する前のデータでしたか。


    >ところで、打者のタイプ分けをするなら、当然使いたい指標が、AO/GOですね。
    上げるタイプか転がすタイプかというのは、当然重要なパラメター。

    残念ながら、私もNPBのデータを載せている所は知りません。
    これが入手できたなら田淵氏と金本現監督とかは、大きく変わりそうな予感はありますね。


    >そこで再び、スタッツ分類解析が役に立ちます。AO/GOと近縁にマップされる、そして何処にでも転がっているようなスタッツを代用に使うことを期待しています。

    確かに”ゴロアウト”、”フライアウト”と言う訳には行かないかもしれませんが、HR数やその飛距離等は参考になるかもしれません。
    ただ、これもなかなか入手し辛い情報だと思います。
    HR数はどこでも入手できますが、飛距離となると。。。

  • 「Milky WayのFuture」
    これも何度か取り上げた話題。

    V3さんの古生物学と同じで、天文学も、時間のスケイルが我々人間にとって「悠久」である過去、未来を対象とするために、「確定的」な過去・未来像を描くことが極めて困難なことが多い。

    まず銀河系とM31(いわゆるアンドロメダ大星雲)の将来の衝突・合体。
    200万光年のかなたにあるといっても、銀河系の一番近いお隣さん。

    20年ほど前に初めて可能性が指摘されて以来、何度も論争を経て、今は「起こるだろう」という方向に終結しつつある模様。その時期は30~50億年の未来。

    これらは基本的にはサイミュレイションの結果だが、サイミュレイションの場合初期値、そして付随パラメター(複数)を変えることでそれこそ無数の結果が生まれてくる。

    その中で、「仮説」を支持するものが出てくれば、そしてその頻度が初期値などのパラメターを動かしても安定であるということで妥当性を主張するわけだが、一つ気になるのは「仮説を支持する結果」が出たから仮説が正しいというロジックは成り立たないという事。
    これは、野球掲示板でもよく見かける誤謬。
    「擬陽性」を除外して初めて論理的に「必要十分」条件が成立するわけなのだから・・・

    さて、詳細は別にしてこの間見た新しい所見で面白かったもの。

    重力が宇宙的スケイルの遠距離で、本当にニュートン・アインスタインが予想するように振舞うかどうかという問題に着目して、80年代に通常とは違った式が提唱されていて、
    ttps://arxiv.org/abs/1703.06110
    この修正された重力理論を用いて、サイミュレイションをすると、興味深いことに、両者は既に100億年前にすれ違っていて、その後遠ざかり、現在再び接近する方向へ向かいつつあるということ。

    バレエのダンサーが舞台の上で離れて踊ったり、近寄ってデュオになったりを繰り返して?いるという感じ。ただ、次回の接近では、一応合体すると、現在主流の説に合わせている。

    w.sci-news.com/astronomy/science-milky-way-galaxy-andromeda-01196.html

    元の論文が上のURLにあって、内容はともかく、その図を見れば彼らの主張がほぼわかるだろう。

    もう一つは、アンドロメダM31そのものの生成歴史。
    種々の望遠鏡での観察で、M31のコアや、ディスクが最低2つの違った集団から成り立つことは長く知られていた。M31が、少なくとも2つ以上の星雲の合体したもの(Milky Wayもこの点はおそらく同じ、だが時期がM31の方が最近でその波及効果がまだ沈静化していない)ことが推察されていたが、フランスのグループが再びスーパーコンピュータネットワークを用いて、計算・サイミュレイションを提唱。
    宇宙的時間で、ついこの間(30億年前、笑)に、質量比4:1の2つの星雲が合体したというシナリオを示している。

    日本のインターネットでも紹介されていたが、元の論文にはなかなかよく出来たヴィデオがついていて、それを見るのが解りやすいので、URLを示す(勿論日本のインターネットで元論文なりのURLを示しているものは皆無。ソースを明示することと、読者にとって有益な情報をもっと載せないと、何のためのWEBだかわかりゃしないぞ・・・)。
    tps://www.obspm.fr/la-formation-de-la-galaxie.html?lang=en

    タイトルはフランス語だが、論文の説明は英語(版)、その最後に、2つの映像がリンクされている。
    赤外線・X線望遠鏡でみたM31のコアーの「形態」がサイミュレイションで再現される様を示している。

    30億年前には、まだDinosaurもいなかった。
    地上でこの光景を目撃できた(つまり視覚を備えた)生物はたぶんいなかっただろう。

  • 「Supervolcano」
    最近、鬼界カルデラの話題が多いので。

    世界に10もない、Supervolcanoの一つが日本にあるといえば、普通は「阿蘇」「富士」などという名前が出てくるだろうが、それが鬼界カルデラ。その事実は、15年ほど前から、英語版のWikipediaなどで紹介されていたが、当時は日本人のほとんどが「それ何処にあるの?」という状態だったことと思う。

    Superの定義は、一回の噴火で噴出される溶岩の量が、10E9のレヴェル。
    現在地上で活動中の火山の多くが10E7から8ということで、 その巨大さがうっすらと想像できる程度。

    ここでも紹介した現在神戸の巽博士のグループが活発に研究調査を続けている。


    Yellowstone国立公園が、Supervolcanoであり、過去に何度も「壊滅的(Catastrophic)」な噴火を繰り返してきたことが、過去20年ほどの研究に明らかになり、USのNational GeographicやDiscovery チャンネルが、「もし今Yellowstoneが噴火したら」という想定映画を作っていたが、その頃日本では、同種の研究は皆無だった。少なくても、目に見える形で出てきたものはなかった。

    Supervolcanoという言葉そのものが紹介されても、日本語のWikiのページもなければ、日本語のインターネットサイトなどもない。そういう状態だった。
    おそらく日本では「予算」が付かなかったのが、巽さんたちのグループが政府に働きかけることでようやく研究が軌道に乗ってきたのだろう。

    火山列島といいながら、火山そのものの研究や災害対策(もっともSupervolcanoが噴火したら現在の文明レヴェルでとれる対策などない・・・・・)も皆無に近いお粗末な状態だったのが、現実に被害が起きて遅まきながら動き始めたというように見える。

    tps://headlines.yahoo.co.jp/videonews/jnn?a=20180213-00000026-jnn-soci

    溶岩ドームが世界最高規模というのは恐ろしいが、更に大事なことは、その地下に存在するマグマ溜のサイズ。

    研究が先行しているYellowstoneでは、医学でも使われる断層映像の手法を用いて地表に近いところの溜りのサイズ、その地下にある遥かに大きい第二のマグマ貯留層、更にはそのもっと地下のものまでサイズの測定が行われている。

    英語版Wikiでは、鬼界の火山としてのサイズは、Yellowstoneクラスの20%ぐらいと見積もられていたが、溶岩ドームのサイズが、世界最大級なら、研究が進めば、もっとサイズアップするかもしれない(それそのものは脅威だ・・・)

    実際面はあえて触れずに、Pure Scienceとして見たとき、最近の日本のこの方面の進展はとても興味深い。

    「一人の先覚者」が、時代を、社会を変えつつあるという意味でも。

  • >>9897

    自称セイバーメトリシャン chijohnohoshi_x (表示名 Betelgeuse )

    結局昨年も復活は無し。
    岡田がやめてオリックスに用がなくなったのはわかるが、なぜか阪神カテでは活動せず消えてしまう阪神ファン。

    依然56コメントで止まっている。
    https://textream.yahoo.co.jp/personal/history/comment?user=oyC_g5R3vCgI5HYfStfUzF_p8wo-

    (仕様変更によりIDが表示されなくなった。今後の呼び名は表示名の Betelgeuse )


    恥ずかしくて動かせない Betelgeuse の代わりに、周囲にはバレないように「こそこそ」とした形で、俺に必死に反発を示していた本ハンドルのほうの動きも衰えた。

    呼びかけがあっても応じなくなった。
    一時は積極的に加わろうとしていた話題にも触れようとしなくなった。

    当然だろう。
    元からそんな絡みに大した欲求がない。

    俺が書き始めた一昨年、こいつは一時的に、自分から積極的に「まとも」な交流を持とうなどと、それまでにはなかった珍しい姿勢を見せてまで動こうとしていた。

    関わりを避けていた相手(アラシ等ではない)にも声を掛けるなど異様な動きを見せていた。

    本当にそういう交流を求めてるなら、それまでにも「もっと」やってきただろうし、今だって「もっと」やろうとするだろう。

    こいつがそうまでして「頑張って動いた」のは俺の投稿後しばらくの間だけ。

    こいつは俺に何も言えない、言うわけにいかない。
    俺への反発は「平気ぶって動く姿」を見せることで示そうとする。
    そうすることで俺の投稿が堪えていないことをアピールしようとする。

    否定ではなく「堪えていないこと」のアピールとして。

    とにかく動きを見せなければならない。
    俺に平気ぶりを強くアピールしたいこいつは、オーバー気味にやろうとする。

    その為に動きの「数」を欲しがった。


    俺への反発の為にはそれまでとわざわざ動きを変えようとする。
    やりたくないことでもやろうとする。
    誰だって利用しようとする。

    こいつはそれだけ俺への反発を最優先に考えている。


    平昌が始まった。
    ソチに続いて平昌も「飛び越えよう」としているこいつはまだまだ動かない。
    こいつはそういう話題に関わることを恐れている。

    つづく

  • >>10471

    >こう言うイメージが裏切られるのは大好き。
    いや、なかなか面白い(笑)。

    こういう感想をいただければ、冥利に尽きる思いですね。

    ところで、打者のタイプ分けをするなら、当然使いたい指標が、AO/GOですね。
    上げるタイプか転がすタイプかというのは、当然重要なパラメター。

    ところが、MLBではどこにでも転がっているこのスタッツ、日本ではマイナーな個人運営のサイトにしかない。しかも、そのうち一つが「閉鎖」になって今見つかりません。少なくとも私はアップ・トゥー・デイトなサイトを知りません。

    そこで再び、スタッツ分類解析が役に立ちます。AO/GOと近縁にマップされる、そして何処にでも転がっているようなスタッツを代用に使うことを期待しています。

    それも、分類解析を試みた一つの理由でした。

  • >>10471

    >一つ確認したいのが、現役ではない選手、または移籍してきた選手の成績は生涯成績ですよね?

    V3さん、 おはようございます。

    良いところをついてこられますね。
    実は、今回は、「黎明期」のデータを使いました。

    多くの選手が、例えばOPSなり、SLGなりを見ると、3年ほど生涯の頂点を示す時期があります。その直前の2、3年を使っています。

    理由は、現在上昇中の若手と比較して、彼らの近未来を占うためでした。

    もちろん、彼らの生涯平均値を使った再分類も予定していますし、何より、絶頂期のデータを使った分類がどのような結果をもたらすかも大きな興味を感じるところですね。と

    おそらく、今回の結果とは違った関連図が成立し、黎明期と成熟期ではタイプが変化する、昆虫の変態のような現象もみられるかもしれないと予想しています。

    それにしても、これら「大物」の数値を見ていて思ったことですが、黎明期を定義するのが難しい。

    掛布なんて、18歳ぐらいで入団していながら、3年目からすでに長打率600越え、OPS1.0越えでしょう。早熟の天才ですね。

    ファームでもたもたしているようでは、そこからもう「違うタイプ」と見なさざるを得ない。時間軸も入れた分析も考えて見る必要がありそうです。

  • >>10467

    USAさん、こんばんは。

    一つ確認したいのが、現役ではない選手、または移籍してきた選手の成績は生涯成績ですよね?
    いや、意外だったのは掛布氏と岡田氏が、左右の違いはあれどかなり似通ったタイプである事と、金本現監督と田淵氏とがかなり似通ったタイプである事。
    私の中では完全にイメージを裏切っています(笑)。
    こう言うイメージが裏切られるのは大好き。
    いや、なかなか面白い(笑)。

  • 「解読」

    さて、ヒートマップ図の解読。
    まず、一番上のクラスター(関連性の高いグループ分け)を見てみる。

    スタッツは、
    3B(3塁打の数)
    SB(盗塁)
    CS(盗塁死)
    AB/HR(ホームラン一本に必要な打数、つまりはホームランを打つ能力)
    SAC(犠牲バント)

    この5つが一つに纏められている。
    そして、隣り合わせに結ばれるものほど相関が高く、隣同士であっても、「樹の高さ」が高いほど、相関は低い(遠縁)。

    まず最も近縁なのが、盗塁と盗塁死。
    これがまず面白い。
    つまり、盗塁死は、盗塁の数にほぼ比例するということ。
    XR27 式などを見れば、盗塁のゲインが、0.17、盗塁死のマイナスが0.34とされている。

    盗塁で正の得点を得るためには、盗塁成功を増やし、盗塁死を減らさねばならない。
    当然のこと。しかしロスがゲインの2倍あるから、ほぼ66%以上の成功率でなければ、そもそもプラスにすらならない。走っても走っても「得点機会」をつぶすだけのこと。

    ならば、かつてイチローが実践していたように成功率80~90%を目指すか?

    このグラフは、一般選手のレヴェルでは、盗塁死の数∝盗塁成功の数ということで、その比率を変えることは困難であることを意味している。

    もちろん特殊スキルを磨くことはプロフェッショナルにとっては武器。しかし、80%で、年間100盗塁したとしても、0.17x80-0.34*20=6.8ということで、こういう選手を3人ラインアップに揃えても、年間で20点ほどしか叩き出せない。

    得点力増強のためには、他の方法を考慮するほうが良いという結論になりそうだ。もちろんこれは、盗塁という戦術だけで、機動力を向上させる(走塁の要素をもっと生かす)という戦術を否定しているわけではない。
    それは、このアプローチでは検討していないというだけのこと。

    さて、寄り道はここまでにしてグループ化される次のスタッツにいってみよう。

    盗塁群に近いのが、なんと、ホームランに要する打数。これは、論理的には理解できない。
    一つの可能性としては、この両者が「イヴェント頻度」で偶々近いところにいるのかもしれない?

    ただ、打者のサンプリングの数をもう少し大きくして検討してみる必要がある。
    これが、「Work in progress」ということ・・・・

    さて、盗塁群とHRの頻度をグループとして纏めれば、3塁打とつながってくることは逆に理解できる(逆に、HR頻度がこの位置に入ってきたのは、3塁打の傘という原因かもしれない)

    つまり、3塁打は、「長打力(∝本塁打頻度・・だけではないが2塁打と本塁打とも相関があるという意味で)」と「走塁力」との和という一般的な理解を裏付ける結果といえるのではないか?

    予想や思い込みなしに、(Unsupervised / unbiasedということ)ランダムにデイタを分析する事で得られた結論は、より真実を反映している可能性が高い。

    しかし、これが、「False Positive(偽陽性)」であることを除外するためには、サンプル数をもっと増やし、違う年度や違う打者層(例えばNPB)で検証する必要もある。
    そこは宿題・・・・・

    とりあえず、このぐらいで今日はおしまい(次の仕事が来た・・・苦笑)。

  • さて、少し暇ができたので続きを。

    もともとの目的は、多変数相関解析を用いて、

    1「比較的よく使われる打撃スタッツ(なり投手スタッツ)の中から、最も選手の能力を多方面に分析できるデイタセットを抽出する」

    もう少しテクニカルに説明すると、多くのスタッツは、その定義上似た対象を見ている。例えば、SLG(いわゆる長打率)とIso-Pは、Iso-PがSLGの一部であるだけでなく、打率とエキストラベイスヒットとの傾斜配点であるがゆえに、相関が非常に高い。同じく打率はSLGの一部ではあるけれども、傾斜配点上1の重みしか与えられていないから、SLGには効いてこない。つまり、IsoPと打率(BA)とは、かなり独立は能力を見ているということになる。

    2 そのデイタセットを用いて、発展途上の選手と、過去の選手との「相似性」を見つけ、これから先の発達具合を予測してみる。

    ということになる。

    1の部分だが、上のIso-PとSLG, BAとの説明のような「論理」的Instructionで機能的に進める代わりに、純粋に「ありとあらゆる変数」をランダムにアルゴリズムに投入して、その結果から「AとBとは近いものを見ているが、AとXとは違った能力の指標」という判定をするほうが、バイアスを排除できる(こうアプローチをランダム・スクリーニングという)。

    そこで、2017年のMLBのバッティングスタッツを用いて(ESPNとMLB.COMでは違ったパラメターを掲載しているので、両者をドッキングし、重複を排除した)40人の打者の実際の成績を基にして、ヒートマップ(相対的にその選手が、対象となるパラメターで優れているなら赤、平均から下がるにつれて緑の色で表される)を作成した。

    選手相互の、そしてスタッツ相互の関連性が、樹上図で示されている。選手の方は省いた。この段階ではまだ重複しているスタッツ・パラメターが多すぎるので、この比較は意味をなさないから。

    逆に、「似たような選手を選んでいた」ら、スタッツの方の関連性もバイアスのかかったものになるが、人間の多様性は、普通測定値の多様性よりはるかに大きいので、無検討でOKとする。

    その結果が以下に示した図(ダブルクリックを繰り返すことで拡大できる)。
    これを具に睨むだけで、いろいろなことが見えてきて、小一時間ぐらい楽しめる・・・・

    好きに書き込もう、タイガースファン限定 さて、少し暇ができたので続きを。  もともとの目的は、多変数相関解析を用いて、  1「比較的よく使わ

  • >>10467

    図ですが、ヒートマップといわれるものです。

    赤は、数値が高いこと、緑は数値が低いこと(元の生デイタを2項分布になるように正規化しているので、平均より上と平均より下という数字が、プラス・マイナスで現れます)

    あれ不思議とかおかしいねということもいろいろ出てきて当然です。

    ご質問いただければ答えますし、もともとそれぞれの選手のデイタにはある思惑を加えてあって、例えば「選手生活における平均値(これが選手のイメージに近いものかもしれません)」ではありません。

    そもそも、In Progress(試行錯誤)の結果でもありますから。

  • 「変数群」
    さて、プロセスその1は適切なる変数群の選択。

    いきなり試行錯誤の結果を出しましょう。

    多変数解析の根本は、使う変数同士が、あまりに従属であるなら、それらを代表する一つを選ばなければならないということ。

    そうでないと、互いに連関したパラメターを5つと、独立したパラメター1なら、類似部分が「誇張」されてしまいます。

    アナロジーでいくと素因数分解のようなものでしょうか。
    互いに割り切れない数字のベキという発想を変数(野球スタッツ)に戻すと、相関性の有無ということになるでしょうね。

    これがなかなか手間のかかるプロセスです。

    以前の投手の時、例えばKK/BB(奪三振数/与四球数)というスタッツは、KK/BA BB/BAの”Derivative”で、KK/BA、BB/BAは独立(相関性が非常に低い)から、3つを使うことは許されないが、2つは必須という選択をしていました。

    打者の場合、例えば打率と長打率とか、打率とOPSという変数は、独立ではありませんね。
    何故ならOPSにも長打率にも打率が要素として含まれています。

    打率とIso-D、Iso-Pとがそれぞれ同士の相関が低く独立したパラメターであることは、直観的にも頷けるでしょう。

    さて、ここに、HRの打席毎の率をいれるとどうなるか?何打席に一回歩くかという変数を加えると?

    これは、結果で示しましょう。
    実際にタイガースの20人ほどの打者で分類(打者毎のクラス分けと変数のクラス分け両方できます)をしてみたものです。
    下図。

    なるほど、Iso-Dと歩く割合、そしてIso-Pと本塁打当りに必要な打席とは、変数のクラス分けで極めて近傍にマップされます。

    当然とはいえ、この分類方法の科学的根拠を試すことにもなっています。

    Iso-Dの定義が、出塁率ー打率、Iso-Pが、4x本塁打/打数+3x3塁打/打数+2x2塁打/打数という線形連結式であることを見れば、HR/打席(あるいは打席/HR)とIso-Pとが縁の深いことは再び無理なく受け入れられると思います。

    付図(大きくするときはダブルクリックx2)の、上方向の系統樹を見ると、Iso-PとHR/打席、そしてIso-Dとウォーク/打席とが、近い変数(それぞれの関係に加えて、縦の長さが、短いほど相関が高いということでもあります)

    横の系統樹は打者同士の近縁関係。

    敢えて詳しくは説明しません。御覧になって、「ああそういうこと」「へえ」と思っていただければ。
    もちろん、現時点ではまだ「変数群」の最適化も終わっていませんし、それぞれの選手のデイタも「抽出」なので(ただ、ちょっと面白い抽出方法を使ってはいます、微笑)、分類に関しては、信頼性の低いものであることはお含みください。

    好きに書き込もう、タイガースファン限定 「変数群」 さて、プロセスその1は適切なる変数群の選択。  いきなり試行錯誤の結果を出しましょう。

  • さて、広げた風呂敷を少したたんで、「目標」を明確に設定してみようと思います。

    以前のものは、NPBのかなりの数の投手を、5つぐらいのスタッツを基に、誰と誰とが近縁のタイプか?という分析を試みたものでした。

    今度は打者でやります。

    まず、タイガースの歴代の有名打者たちを、グループ分けできるか?

    具体的には、例えば真弓や和田、岡田と似ている若手選手は誰か?などという質問に答えられる解析法の樹立です。

    そのためには、スタッツの選択が重要になります。
    不備なスタッツの集合なら、ありえないグループ分けに終わってしまうでしょう。
    といって、ここで難しいのは、主観に逆らう(Counterintuitive)な結果が、即「失敗」ではないということで、絶対的なスタンダードのないところで、新しいスタンダードを樹立する必要があるということです。毎日そういうことを本業ではやっているわけですが(苦笑)。

    第一段階が終わったら、こんどは打者集団を、「キャリア確立後の絶頂期」のスタッツと、「キャリア開花直前」のスタッツを基にグループ分けし、直前とその後で同じ打者が同じグループに属するのかという質問に答えてみたいと思います。
    これは、生物の進化の方向性のようなものですね。打者にも進化の方向性があるのか?
    そしてそれは、双葉の段階で属するグループによってある程度、決定されるものなのか?

    直観的には、Iso-Pなどは、生来のものだから、飛ばす能力を持つ打者は生得のものということは首肯できると思います。
    それが解析で支持されるのか?

    もしそれが支持されるなら、キャリアの初期の打者の「選ばれたスタッツ」を分析する事で、将来の能力予測ができるという結論が出てきても良いですね。

    つまり、現在頭角を現しつつある選手の未来予測。

    どこまでモノになるかわかりませんが、暫く遊べそうです・・・・



    もし、

  • >>10464

    V3さん、こんにちは。

    出アフリカもそうですが、古生物ではある生物種の生物学的分類位置が、しばしば変更になります。
    昨年春に、恐竜の分類が、結構大きく変わった時には、確かここでも取り上げたと思います。
    tps://www.theatlantic.com/science/archive/2017/03/dinosaur-family-tree-saurischia-ornithischia-childhood-shattered-what-is-real-anymore/520338/

    あの規模の変更は、オセロゲイムのように見えます。
    これまで相当の量のデイタが集まっていて、考察も終盤に差し掛かっているはず(?)なのに、一つ新しいデイタセットが加わるなり、デイタの解釈を微妙にかえることで、一夜にして根本的に定説が裏返ってしまうわけですから。

    そのこと自体不思議ではないでしょうか?
    科学とはそんなに、「あやふや」なものなのか(苦笑)。

    Dinosaurの分類の場合、化石をもとにしたデイタに、最近ならDNA解析のジェノムデイタなども加わっていて、それらを「多変数解析」してある種ともう一つの種との近縁関係を数量化、それを多数の標本、種について積み上げていくプロセスに従っているはずです。

    この解析の部分は、もっと身近に野球の計数デイタにも応用できて、それも昔ここで遊んでみたことがありました。

    偶々、本業の方で再び最近毎日このアルゴリズムを使っているので、もう一度取り上げてみようかと思います。
    以前もStudy in Progress の形に近かったのですが、今回はもっと試行錯誤の過程も取り上げてみようと思います。

    何故多変量解析が時に「オセロの大番狂わせ」のような状況を引き起こすのか、客観と主観のかなり微妙な狭間も見えてきそうです。

    V3さんの「新しいスタッツの開発」に比べてこちらはやや後ろ向きですが、もう少し込み入ったな解析手法の応用で、何か新しいものが見えてくるか?

  • う~ん。。。

    tp://www.afpbb.com/articles/-/3160497?cx_position=17

    記事としては中途半端だなぁ。。。
    どの様に「アフリカと欧州の間を移動していた可能性があることを示している。」と結論付けられてたのだろう。。。
    地続きだった時期もあるので、当然行き来はあったのだろうが。。。


    tp://natgeo.nikkeibp.co.jp/atcl/news/18/012900041/

    またまた出ました。
    今回は出アフリカについて。
    まだまだ謎が多い。。。

  • >>10462

    あぁ。。。勘違い。。。

    USAさん、こんばんは。

    >+0.04*犠打という項目がありますね。

    冒頭に書いた様に勘違い。。。顔から火が出ています(苦笑)。


    >纏めてみれば、中立点がゼロではないということではないでしょうか。

    なるほど。。。やはり、固定観念からZEROからプラス、マイナスと言う見方をしてしまっています。
    私も頭が固い。。。


    >ただ、ここで、”重回帰式(線形加算)”の有効性に対する疑問から、XRよりはLWTSやRCの方が・・・という記載がありますが、これは私の知る限り”疑問”が呈されているものの”否定”はされていない案件だったと覚えています。

    これ、私も”話題”として知っていました。
    まぁ、「何を見たい(知りたい)か」によるのでしょうが。。。

  • >>10461

    >この式で思うのは、犠打に対して。
    プラスもマイナスも補正値が無い事。

    あれ?

    質問です。

    ご紹介の日本語のページですが、
    +0.04*犠打という項目がありますね。

    しかし、V3さんのご指摘通り、得点期待値を減らすべき犠打にポジティヴの係数が与えられているのは何故か?というのは、大変重要な問題だと思います。

    これについては、例えば安打の係数0.5、ウォークのそれが0.34であることに比べて0.04という数字は相対的にマイナスであると理解しています。

    例えば凡退は、もちろんマイナスですが、0.09に過ぎませんね。
    つまり、ゲイムが進行してゆくという「条件」がある程度の「モーメンタム」をもって正の方向へ進んでゆく(抽象的な言い方で申し訳ありませんが、野球ゲイムにはすごろくなどのように、「2つ戻る」という罰則的減点がありませんね。それがこのような形で数式に反映されているのではないかと。例えば凡打の負係数を大きくすると、試合半ばで得点したものが相殺されてしまうという状況もありえます。

    纏めてみれば、中立点がゼロではないということではないでしょうか。

    そんな”雑談風”の迷走を経て、もう一度数字を眺めてみると、例えば盗塁死が実に0.34という大きなマイナスを与えられていることが一層面白いと思います。想像以上にチャンスを大きくつぶすという事象だと理解しています。

    敬遠の場合など、2つの項目に姿を現していますが、それを足すと、”-0.09”と「凡退」と同じマイナス係数になりますね。

    敬遠という現象が、強打者がスコアを得やすい状況(あえて、スコアリングポジションという定義の曖昧な言葉は使いません)に起こりやすいこと(安直に投手の前なら敬遠ということは、ある地法的?な風習だと割り切って)から、普通なら大量得点につながるであろう打者が一つだけ塁をゲインするのは、凡退と同じ重みであるということ・・・つまりは攻撃側にとっては”非常に残念”な事象であること。

    今、敬遠申告制について論議がなされていますが、正直これはあまり”正々堂々”とした戦術とは思えないので、美意識に拘りたくありません。

    ”あ、そ~いう手にでたの?へっChicken野郎”
    で宣告即ウォークでよろしい(笑)。

    それからこの日本語のペイジですが、蛭川さんはセイバーメトリクスリポートの編集者ですね。名前だけは、以前から存じ上げておりました。

    ただ、ここで、”重回帰式(線形加算)”の有効性に対する疑問から、XRよりはLWTSやRCの方が・・・という記載がありますが、これは私の知る限り”疑問”が呈されているものの”否定”はされていない案件だったと覚えています。

    正直LWTSも同じ発想ではないかと思うことがしばしばですが・・・

    まあそういうことから、式の形が最も”野球現象を細かく分析”した故に、”長ったらしい(笑)”XR式を個人的に好みます。

    眺めていて科学的に美しい式(現象を還元主義的に説明している)だと個人的には思っているので。

  • >>10459

    う~ん。。。
    やはりこう言う投稿がないとここらしくないね。
    私もニュースタッツを頑張らねば(笑)。
    USAさん、こんばんは。

    >XR(Xtrapolated Runs)を使う。

    私が知っている式は以下のとおり。
    tp://1point02.jp/op/gnav/glossary/gls_explanation.aspx?eid=20045
    まぁ、いつも思うのが。。。式が長い!(笑)
    と、冗談は置いといて。。。
    ご紹介のページには3つほど式が載っているようですが。。。
    この式で思うのは、犠打に対して。
    プラスもマイナスも補正値が無い事。
    得点期待値から考えるとほとんどの場合において、期待値が下がる犠打に対して。。。何故補正値が無いのでしょうね?

  • さて、続けよう。

    前稿で、飛ぶボールと飛ばないボールについて、逆の記述をしてしまったので、あの部分はとりあえず無視して欲しい。

    言いたかったことは、「甲子園では攻撃乗り守り」という金言に従えば永遠に優勝できないということを述べたかっただけ。これは数理的に残念ながら真実。だから、大胆なティーム編成(というのはタイガースの90年代以降は非常に「憶病」なドラフト戦略+非日本人打者採用にこだわってきたから)が必要で、スカウトの刷新も必要だ。ここらのインフラストラクチャーの弱さが、過去20年のタイガースを蝕んできた。

    さて、広島カープとの比較は、かなり「絶望的」である。

    打、特に得点と相関しやすい長打力においては、大人と子供の差といえる。
    2塁打で15点、ホームランでは50点ほどの差をつけられている。これだけで得点力において70点の差。
    ここに、単打でも30点の差。これは打率であって、長打力とは独立の打のパラメター。

    総合打力は、Iso-Pなどの「純粋長打力(飛ばす能力」+「打率(当てる能力)」できまる。これが長打率(と長打力とは違う)であることは、周知だろう。強調したいのは、当てる能力と飛ばす能力は相関しないということ。多くの打者の経年変化を見ると、成長といわれる部分は殆どが「当てる能力」の向上であって、「飛ばす能力」を伸ばせた打者は非常に数少ない。敷衍すると、「飛ばす能力は天与」「充てる能力は後天的」と言い換えられるだろう。
    しかし、現在の金本政権を含め大方のNPBでは、「当てる打者」に圧倒的な優先順位を与えている。これも無理はない。打線を構成するうえで、過半数の打者には当てる能力を優先してもよい。そうでないと出塁率が下がり過ぎて総得点が伸びない。

    しかし、最低3人ーいわゆる中軸というのは3~5番の三人で、これを1,2,4に置き換える方が数理上は得点力は更に上がるが、それは踏み込まず、3人という数字が経験的に打線の「特別分子」と考えられてきたことに言及するー には、「飛ばす能力」を求めるべきだし、若い大砲を育てるときにも、当てる能力に多少目を瞑ってでも飛ばせる人間にチャンスを与える必要がある。これは近年飛ばす能力を欠いてきたタイガースでは特に切実な問題だ。

    今のリソースなら、なんとか陽川を使えるようにしないと(特に上に来た時、緊張?からか、当てる能力が減衰してしまう)、そしてロサリオ・中谷・陽川の3銃士を得点源として、そこに出塁に強い鳥谷や福留、糸井(意外だが糸井は出塁型打者と考えてもよい)というヴェテランをうまく組み合わせることで得点を伸ばす戦略を考えるべき。
    鳥谷6番など愚の骨頂だ。


    さて、グラフを見ると、選球眼ではタイガースはカープに劣らない(いや、タイガースが唯一リーグをリードする選球眼ですらカープには大幅に卓越できないというべきか)。

    機動力機動力と声高な向きも多いが、盗塁+盗塁死をみれば、カープがせっせと走ってせっせと点を失っていることが見えるだろう。ゲイムはこういうイヴェントがあった方が面白いが、今のメンバーで、タイガースはあまり余計なことを考えない方が良い。せいぜいシーズンで10点以内の差だ。
    かつての赤星のような「特殊才能」の持ち主が出てきたら考えてもよいが。

    従って現在のタイガースとカープには一軍と二軍ほどの打力の差があってどうしようもない。

    来年、カープが大幅に打力を落とすこともないだろうから(カープは簡単に2種類の打線が組める人材の充実ぶりだ)、ロサリオの予想外の活躍と、陽川の長距離打者としての一軍定着、原口の捕手固定がない限り、タイガースが優勝することはない。

    得点力にして100点の差。ロサリオ35本(韓国でもこの程度しか打てていないのにレヴェルが高いNPBで打てるかな?)、陽川25本(中谷だっていきなり20本は打った。しかし陽川はメンタルに脆弱で、当てる能力がまだ一軍レヴェルにない・・・)、原口15本。(中谷はすでに今年20本だから、これ以上大幅な上乗せは無理だろう。むしろマークされて減る可能性だってある)。
    これで、75*1.44=108。大幅に得点力の差があるHRだけに拘ってみた。

    現行+これだけの上乗せがあって、打率で劣るタイガース打線(何度も書くが、当てる能力と飛ばす能力両方で大差をつけられている現状は大人と子供の勝負に近い)がカープ打線と同程度、700点という得点をたたき出せるが、これはどれほどの楽天家であっても、首をかしげるだろう。
    そして、首脳は腹をくくって、3銃士に対しては「長打>>打率」というスタンスを維持しないと無理。

    数値的現実・・・は楽しくないね。大外れして欲しいもの・・・

    That said、今年のタイガースの頂点を目指す健闘・奮闘祈る。

    追記:グラフを拡大したいときは、ダブルクリックx2, please.

    好きに書き込もう、タイガースファン限定 さて、続けよう。  前稿で、飛ぶボールと飛ばないボールについて、逆の記述をしてしまったので、あの部分

  • <<
  • 10479 10460
  • >>
並べ替え:
古い順
新しい順
アプリでサクサク「掲示板」を見る Yahoo!ファイナンス公式アプリ
かんたん口座開設・販売手数料無料!! ヤフーグループのYJFX! 投資信託