【初心者向け：R】特定の行だけを抽出してテーブルを作るには？filter()の使い方をわかりやすく解説【tidyverse推奨】

2025年4月30日

URLをコピーしました！

こんにちは。ほしのはやしです。

たとえば、「スコアが90点以上の人だけ抽出したい」「性別が男性のデータだけ残したい」など、特定の条件を満たす行だけを取り出す操作は、データ分析において最もよく使われるテクニックの一つですよね。

この記事では、tidyverseのfilter()を使った特定の行の抽出方法をわかりやすく解説します！

パッケージ（tidyverse）を用いた『filter()』で行を抽出

まずは以下のコードで練習用のテーブルを作成します！

library(tidyverse)

df <- tibble(name = c("Tom", "Yam", "Sue"),
             score = c(90, 85, 92),
             sex = c("Male", "Male", "Female"))

これのうち、scoreが90以上の行だけ取り出したい場合は、

# 例1: score >= 90 の行だけ取り出して、新たにdf2というテーブルを作成
df2 <- df %>% filter(score >= 90)

もし性別Maleだけを取り出したい場合は、以下のようにします。

# 例2: 性別Maleの行だけ取り出して、新たにdf3というテーブルを作成
df3 <- df %>% filter(sex == "Male")

さらに発展させて、『A条件かつB条件』または『A条件またはB条件』についてのコードは以下になります。

# スコア90以上かつMaleの行を抽出
df4 <- df %>% filter(score >= 90 & sex == "Male")

# スコア90以上またはMaleの行を抽出
df4 <- df %>% filter(score >= 90 | sex == "Male")

【論理演算子のまとめ】
1. AND (&)
左右の条件が両方とも真（TRUE）の場合にのみ、結果は真（TRUE）となります。
例：score >= 90 & sex == “Male” （スコアが90以上かつ性別が “Male”）

2. OR (|)
左右の条件の少なくとも一方が真（TRUE）であれば、結果は真（TRUE）となります。
例：score >= 90 | sex == “Male” （スコアが90以上または性別が “Male”）

3. NOT (!)
条件を否定します。条件が真（TRUE）であれば偽（FALSE）を、偽（FALSE）であれば真（TRUE）を返します。
例：!(sex == “Male”) （性別が “Male” ではない）
例：score < 90 は !(score >= 90) と同じ意味です。