-
臨床研究で統計的有意差を得るには何人必要?Rで学ぶサンプルサイズの決め方
こんにちは。ほしのはやしです。 臨床研究を計画する上で欠かせないのが「サンプルサイズ(N数)の設計」です。 サンプルサイズが不適切だと、せっかくの研究も信頼性を欠く結果となりかねません。 この記事では、臨床研究におけるN数の決め方を、概念から... -
【初心者向けR講座】miceパッケージで欠損値をうまく扱う方法!感度分析も簡単!
こんにちは。ほしのはやしです。 欠損値は、統計解析や機械学習でしばしば避けられない問題です。特に、感度分析を行う際に欠損値があると、結果の信頼性に大きく影響を及ぼします。 このページでは、Rのmiceパッケージを使って欠損値を補完(インプテーシ... -
【初心者向けR講座】感度分析(Sensitivity Analysis)とは?
こんにちは。ほしのはやしです。 医学研究や疫学研究では、「この結果は前提が変わっても変わらないのか?」という疑問がよく出てきます。 そんなときに役立つのが感度分析(Sensitivity Analysis)です。 このページでは、感度分析とは何か、どんなときに... -
【初心者必見】RでのNA補完に要注意!平均・中央値での補完が危険な理由を医学研究の実例で解説
こんにちは。ほしのはやしです。 Rを使ったデータ分析で欠損値(NA)があると、「とりあえず平均値や中央値で埋めておけばいい」と考えがちです。 たしかに、これらの手法はコードも簡単で、tidyverseを使えば数行で実装できます。補完の基礎について以下... -
【初心者向け:R】グループごとに欠損値の補完方法(平均・中央値)を変えるには?case_whenの使い方を徹底解説【tidyverse推奨】
こんにちは。ほしのはやしです。 NA(欠損値)に対して、基本・平均値/中央値での補完の基礎について以下のページで解説してきました。 実際のデータ分析では、「グループAは平均で補完したほうがよいが、グループBは外れ値があるから中央値で補完したい」... -
【初心者向け:R】欠損値(NA)を補完するには?平均値・中央値での埋め方をわかりやすく解説【tidyverse推奨】
こんにちは。ほしのはやしです。 データ分析では、NA(欠損値)に遭遇するのは日常茶飯事。そのままではエラーの原因になったり、分析に使えなかったりします。 今回は、初心者でも使いやすい「平均値補完」「中央値補完」という基本テクニックを、具体的... -
【初心者向け:R】欠損値(NA)を扱うには?na.rmとis.naの違いを徹底解説【tidyverse推奨】
こんにちは。ほしのはやしです。 Rでデータを扱っていると、「NA(欠損値)」という文字に出会うことがあります。これは「そのデータが存在しない」「記録されていない」ことを意味します。統計解析やグラフ作成の前に、欠損値の扱い方を理解することはと... -
【初心者向け:R】列が多くて見づらい!across()で集計した結果を見やすく整える方法【tidyverse推奨】
こんにちは。ほしのはやしです。 Rで複数の列に対して平均や標準偏差などを一括計算する方法として、across()+summarise()は非常に便利です。ただし、集計対象の列が増えると、出力の列数が膨大になり、非常に見づらくなってしまうのが難点です。 今回は... -
【初心者向け:R】複数の列を一括で集計するには?across()の使い方をわかりやすく解説【tidyverse推奨】
こんにちは。ほしのはやしです。 Rで複数の列に対して「平均」や「標準偏差」などを一括で計算したいとき、tidyverseパッケージに入っているacross()がとても便利です。 この記事では、初心者でも使いやすいacross()の基本と応用を、具体的なコード付きで... -
【初心者向け:R】データをグループ毎に集計するには?group_by()とsummarise()の使い方を徹底解説【tidyverse推奨】
こんにちは。ほしのはやしです。 統計を考えるときに、複数の観測値をグループごとに集計することがよくあります。たとえば、「地域ごとの売上合計」や「性別ごとの平均年齢」など。そんなときに大活躍するのが、tidyverseのパッケージに含まれるdplyrの g... -
【初心者向け:R】列を追加・加工するには?mutate()の使い方をわかりやすく解説【tidyverse推奨】
こんにちは。ほしのはやしです。 年齢を65歳でわけた列を作りたいとか、複数の列の数値を計算してスコアの列を作りたいとか、列を加工する操作は、データ分析において最もよく使われるテクニックの一つですよね。 この記事では、tidyverseのmutate()を使っ... -
【初心者向け:R】特定の列を抽出・変更してテーブルを作るには?select()の使い方をわかりやすく解説【tidyverse推奨】
こんにちは。ほしのはやしです。 いろんなデータを集めたけど煩雑だから、特定の条件を満たす列だけを取り出す操作は、データ分析において最もよく使われるテクニックの一つですよね。 この記事では、tidyverseのselect()を使った特定の列の操作方法をわか...