Isi kandungan:

Bagaimana anda menapis panda?
Bagaimana anda menapis panda?

Video: Bagaimana anda menapis panda?

Video: Bagaimana anda menapis panda?
Video: Data Science with Python! Filtering Data with pandas 2024, Mac
Anonim

Satu cara untuk penapis mengikut baris dalam Panda ialah menggunakan ungkapan boolean. Kami mula-mula mencipta pembolehubah boolean dengan mengambil lajur minat dan menyemak sama ada nilainya bersamaan dengan nilai khusus yang ingin kami pilih/simpan. Sebagai contoh, marilah kita penapis kerangka data atau subset kerangka data berdasarkan nilai tahun 2002.

Begitu juga, orang bertanya, bagaimana anda menapis Pandas DataFrame berdasarkan nilai nol lajur?

Kepada penapis keluar barisan bingkai data panda yang telah hilang nilai dalam Last_Namecolumn, kita akan mencari indeks bagi ruangan dengan bukan nilai nol dengan panda fungsi notnull(). Ia akan mengembalikan siri boolean, di mana Benar untuk tidak null dan Palsu untuk nilai nol atau hilang nilai.

Begitu juga, adakah panda batal? panda . batal. Kesan nilai yang hilang untuk objek seperti tatasusunan. Fungsi ini mengambil objek seperti skalar atau tatasusunan dan menunjukkan sama ada nilai tiada (NaN dalam tatasusunan berangka, Tiada atau NaN dalam tatasusunan objek, NaT dalam bentuk tarikh).

Dengan cara ini, bagaimana cara saya memilih baris dalam panda?

Langkah-langkah untuk Memilih Baris daripada Pandas DataFrame

  1. Langkah 1: Kumpulkan set data anda. Pertama, anda perlu mengumpul data anda.
  2. Langkah 2: Buat DataFrame. Sebaik sahaja anda menyediakan data anda, anda perlu mencipta DataFrame panda untuk menangkap data tersebut dalam Python.
  3. Langkah 3: Pilih Baris daripada Pandas DataFrame.

Bagaimanakah cara saya memilih lajur dalam panda?

Ringkasan hanya pengendali pengindeksan

  1. Tujuan utamanya adalah untuk memilih lajur mengikut nama lajur.
  2. Pilih satu lajur sebagai Siri dengan menghantar nama lajur terus kepadanya: df['col_name']
  3. Pilih berbilang lajur sebagai DataFrame dengan menghantar senarai kepadanya: df['col_name1', 'col_name2']

Disyorkan: