Isi kandungan:

Bagaimanakah saya boleh meningkatkan prestasi sqoop saya?
Bagaimanakah saya boleh meningkatkan prestasi sqoop saya?

Video: Bagaimanakah saya boleh meningkatkan prestasi sqoop saya?

Video: Bagaimanakah saya boleh meningkatkan prestasi sqoop saya?
Video: Apache Spark Учебник для начинающих | apache Учебное пособие по ... 2024, April
Anonim

Untuk mengoptimumkan prestasi , set yang bilangan tugas peta kepada nilai yang lebih rendah daripada yang bilangan maksimum sambungan yang yang pangkalan data menyokong. Mengawal yang jumlah paralelisme yang Sqoop akan digunakan untuk memindahkan data ialah yang cara utama untuk mengawal yang muatkan awak pangkalan data.

Sejajar dengan itu, apakah yang berlaku jika sqoop gagal di antara proses?

Satu tipikal Sqoop kerja yang menelan data daripada pangkalan data sumber ke dalam HDFS akan menyalin data ke direktori sasaran. Fail yang disalin akan dipadamkan jika sqoop gagal tanpa melengkapkan.

Seseorang juga mungkin bertanya, bagaimana anda mencapai paralelisme dalam sqoop? Mengawal Paralelisme . Sqoop mengimport data secara selari daripada kebanyakan sumber pangkalan data. Anda boleh menentukan bilangan tugas peta (proses selari) untuk digunakan untuk melaksanakan import dengan menggunakan argumen -m atau --num-mappers. Setiap hujah ini mengambil nilai integer yang sepadan dengan darjah keselarian untuk menggaji

Akibatnya, bagaimanakah saya boleh meningkatkan prestasi pertanyaan Hive saya?

Di bawah ialah senarai amalan yang boleh kami ikuti untuk mengoptimumkan Pertanyaan Hive

  1. Dayakan Mampatan dalam Hive.
  2. Optimize Joins.
  3. Elakkan Pengisihan Global dalam Hive.
  4. Dayakan Enjin Pelaksanaan Tez.
  5. Optimumkan operator LIMIT.
  6. Dayakan Perlaksanaan Selari.
  7. Dayakan Mod Tegas Mapreduce.
  8. Pengurangan Tunggal untuk Berbilang Kumpulan OLEH.

Bagaimanakah sqoop split berfungsi?

Ia boleh digunakan untuk meningkatkan prestasi import dengan mencapai kesejajaran yang lebih besar. Sqoop mencipta berpecah berdasarkan nilai dalam lajur tertentu jadual yang ditentukan oleh -- berpecah -oleh pengguna melalui arahan import. Jika ia tidak tersedia, kunci utama jadual input digunakan untuk mencipta berpecah.

Disyorkan: