Isi kandungan:

Bolehkah saya menjalankan Python pada Hadoop?
Bolehkah saya menjalankan Python pada Hadoop?

Video: Bolehkah saya menjalankan Python pada Hadoop?

Video: Bolehkah saya menjalankan Python pada Hadoop?
Video: Belajar Konsep dan Praktik MapReduce dengan Hadoop dan Python 2024, April
Anonim

Dengan pilihan antara bahasa pengaturcaraan seperti Java, Scala dan Ular sawa untuk Hadoop ekosistem, kebanyakan pemaju gunakan Ular sawa kerana perpustakaan sokongannya untuk tugasan analisis data. Hadoop penstriman membolehkan pengguna mencipta dan laksanakan Peta/Kurangkan kerja dengan mana-mana skrip atau boleh laku sebagai pemeta atau/dan pengurang.

Begitu juga, ditanya, bagaimana Python menyambung ke Hadoop?

Menyambung Hadoop HDFS dengan Python

  1. Langkah 1: Pastikan Hadoop HDFS berfungsi dengan betul. Buka Terminal/Prompt Perintah, semak sama ada HDFS berfungsi dengan menggunakan arahan berikut: start-dfs.sh.
  2. Langkah2: Pasang perpustakaan libhdfs3.
  3. Langkah 3: Pasang perpustakaan hdfs3.
  4. Langkah4: Semak sama ada sambungan dengan HDFS berjaya.

Begitu juga, apakah Hadoop dalam Python? Ular sawa adalah tujuan umum yang mengubah bahasa pengaturcaraan lengkap yang boleh digunakan untuk melakukan hampir semua perkara dalam dunia pengaturcaraan. Hadoop ialah rangka kerja data besar yang ditulis dalam Java untuk menangani jumlah data yang besar. Terdapat banyak institut dalam talian yang Hadoop dengan Ular sawa kursus seperti: Analytixlabs. Edureka.

Seterusnya, persoalannya ialah, bagaimana saya menjalankan program Python MapReduce dalam Hadoop?

Menulis Program Hadoop MapReduce Dalam Python

  1. Motivasi.
  2. Apa yang kita nak buat.
  3. Prasyarat.
  4. Python MapReduce Code. Langkah peta: mapper.py. Kurangkan langkah: reducer.py.
  5. Menjalankan Kod Python pada Hadoop. Muat turun contoh data input. Salin data contoh tempatan ke HDFS.
  6. Kod Mapper dan Reducer yang dipertingkatkan: menggunakan iterator dan penjana Python. mapper.py. reducer.py.

Apakah balang Penstriman Hadoop?

Hadoop pengedaran menyediakan utiliti Java yang dipanggil Penstriman Hadoop . Ia dibungkus dalam a balang fail. Dengan Penstriman Hadoop , kita boleh mencipta dan menjalankan kerja Map Reduce dengan skrip boleh laku. Penstriman Hadoop adalah utiliti yang disertakan dengan Hadoop pengedaran. Ia boleh digunakan untuk melaksanakan program untuk analisis data besar.

Disyorkan: