に関する論文がアクセプトされました。論文一つ一つには出来上がるまでの人間臭いストーリーがありますが、今回の論文はかなり思い出深い論文になりそうです。
論文で示している推定値はすごくシンプルなんですが、それを出すために一つの論文では一番長いコードを書いた気がします。理想のデータがないときには、次善の策としてデータを理想に近づけますが(今回は標準化)、複数のミクロデータを要約するのと合わせ、その作業が結構難儀でした(言葉で説明してると簡単に聞こえますが、かなり難儀です)。
論文では、アメリカで最も不利益を被っていると言っていいネイティブアメリカンに注目して、人種別のコロナ死亡率を州ごとに推定し、他のデータと合わせて州レベルの相関から、何が死亡率を引き上げる要因かを推測しています(州レベルの相関か、と思った人はここで読むのをやめてくださって構いません)。分子と分母に異なるデータを使って年齢・カウンティの間接標準化を行うのですが、このマッチングが意外と面倒くさいです(例えば同じカウンティがあるデータではLaGrandeなのですが、別のデータではLa Grandeになっているのです)。
間接標準化をしたあとも、マイノリティの死亡率(この時点で標準化人口との比)を白人のそれをレファレンスにするかで結果も変わるので若干考える必要がありました。標準化死亡率の信頼区間を出したり、保留地が重要な要因であるとわかってからは別の統計を入手したり、思った以上に大掛かりな論文になりました。
とはいえ、このプロジェクトのミソは、学部生発案のアイデアを(ほぼ私が全て)分析して、シニアの先生がエレガントに論文にするという珍しいコラボレーションです。若干寄り道が過ぎた感があるけど、サブスタンティブも、メソッドも、共同研究の分業についても学ぶことは多く、思い出深い論文になります。
今年出そうな論文はこの論文で全てだと思う。2020年はほぼ何も出版できなかったけど、今年は溜まった分も出て、本1冊、英語論文5本(うち1つはデータベース)、日本語論文3本(うち1つは本の1章)と頑張れた。来年は博論にする3章のうち最低1つでトップジャーナル(3大誌+D)のR&Rをとることが目標。3章全てを3大誌+Dに投稿するとすると、持ち玉は12発で、すでに2発使ってしまったので、残り10発で1つ当てれば、今後数年が結構有利に過ごせると思う(発想がギャンブル)
No comments:
Post a Comment