首页
/
每日頭條
/
科技
/
大數據入門三分鐘讀懂hadoop
大數據入門三分鐘讀懂hadoop
更新时间:2025-12-07 22:10:12
Hadoop 概述

從《Hadoop前世今生》中我們知道,Hadoop是從Nutch搜索引擎項目裡拆分出來了兩個通用性的模塊:HDFS和MapReduce,他們主要提供的功能分别是分布式存儲和分布式計算。

Hadoop Common

  • 但是問題來了,分布式存儲和分布式計算都需要網絡通信,所以Hadoop第三個模塊:Hadoop Common就應運而生了,他所做的事情各個進程之間的網絡通信,主要為HDFS和MapReduce提供基礎設施服務,并在此之上封裝了RPC框架。

大數據入門三分鐘讀懂hadoop(大數據系列文章之Hadoop概述)1

從Hadoop 0.x 至 Hadoop 1.x 版本中基本都由Hadoop Common、HDFS、MapReduce構成的,下圖展示了在最初兩個大版本中Hadoop中各組件的結構

Hadoop YARN

  • Hadoop YARN 這個模塊是有什麼作用呢?
  • Hadoop YARN 是如何誕生的呢?隻要是由以下幾個需求推波助瀾才誕生的
  • Hive
  • 我們都知道MapReduce是提供分布式計算的,而這個框架産生之後,Hadoop的使用場景非常廣泛,整個大數據時代對分布式計算的要求也非常高,但是寫MapReduce的作業(也就是Job)的使用門檻非常高,其中需要寫很多處理邏輯,有一些程序員不會寫Job,隻會寫一些SQL語句去代替Job,所以産生了Hive框架,Hive隻需要程序員寫一些SQL就可以自動轉換成MapReduce的作業,進而簡化處理邏輯,降低使用門檻
  • Storm 實時計算以及交互式計算
  • 傳統的MapReduce處理的都是批量的離線數據,處理速度非常慢。随着整個大數據時代的發展,又産生了一些業務場景需要實時計算以及交互式計算,處理速度的要求也相應提升了很多,所以在新的業務場景以及需求下,促生了兩個新的分布式計算框架:storm
  • Spark 基于内存的分布式計算框架
  • 通過使用内存來進行批量計算、實時計算以及交互式計算,大大提高處理速度
  • Flink 基于内存的分布式計算框架

大數據入門三分鐘讀懂hadoop(大數據系列文章之Hadoop概述)2

Spark 和 Flink 的區别

  • 這些新的分布式計算框架都需要申請CPU、内存、網路等計算資源,任務處理完成之後這些計算資源也要自動釋放掉,這些通用功能(資源的申請、釋放、任務的管理)就被抽離了出來,所以 YARN 就誕生了。

大數據入門三分鐘讀懂hadoop(大數據系列文章之Hadoop概述)3

  • 從Hadoop 2 版本開始就新加入了 YARN 來完成任務調度與資源管理的工作,當然我們可以把 YARN 理解為 大數據裡面的操作系統,而上面的應用就是各種分布式計算框架,而 HDFS 和 YARN 需要進行一些網絡通信,則需要調用 Hadoop Common 進行處理(基于RPC)。

總而言之 Hadoop 主要包括以下四個模塊

  • Hadoop Common
  • 為其他Hadoop模塊提供基礎設施
  • Hadoop HDFS
  • 一個高可靠、高吞吐量的分布式文件系統
  • Hadoop MapReduce
  • 一個分布式的離線并行計算框架
  • Hadoop YARN
  • 任務調度與資源管理

,
Comments
Welcome to tft每日頭條 comments! Please keep conversations courteous and on-topic. To fosterproductive and respectful conversations, you may see comments from our Community Managers.
Sign up to post
Sort by
Show More Comments
推荐阅读
倉儲貨架承載标準
倉儲貨架承載标準
倉儲貨架根據不同的屬性可以分為很多種類,不管哪一種倉儲貨架,在使用前都要經過安裝與驗收這一重要環節,才能夠正常投入使用中。貨架的安裝與驗收分為幾個大步驟,我們一起來看一下。一、注意事項與安裝須知1、為了指導貨架通用安裝及驗收,确保質量和安全...
2025-12-07
湖南人文科技學院最新
湖南人文科技學院最新
新湖南客戶端11月3日訊(記者周俊劉芾見習記者鄒娜妮通訊員謝柳劉烨)今天上午,湖南人文科技學院舉行建校40周年慶典大會暨文藝彙報演出。省政協副主席張大方出席并緻辭。作為婁底地方本科院校,40年來,該校為國家培養輸送了10餘萬名各類人才,一大...
2025-12-07
數據庫安全審計的條件
數據庫安全審計的條件
執行數據庫日志分析可讓您對存儲在數據庫中的機密或敏感企業數據的所有訪問進行審核。審核數據庫日志還可通過回答誰更改了關鍵數據、何時更改了關鍵數據等一系列問題,來增強您的内部安全框架。數據庫審核還可以幫助您滿足日益苛刻的合規要求。日志分析一、E...
2025-12-07
日本松下浴霸說明書
日本松下浴霸說明書
前言大家好,我是真真夢。第一次裝修的時候由于缺乏經驗,讓裝飾公司幫忙挑選安裝了浴霸,特别難用不說,沒用到兩年就壞了。我這個卧室面積約5平方米左右,幹濕分離設計(淋浴區域是隔開的)。前段時間換上了衆測申請到的燃氣熱水器,決定順便把浴室也重新打...
2025-12-07
手機安全鎖解除步驟
手機安全鎖解除步驟
手機安全鎖解除步驟?進入手機設置功能,選擇安全和隐私功能,點擊進入,我來為大家科普一下關于手機安全鎖解除步驟?下面希望有你要的答案,我們一起來看看吧!手機安全鎖解除步驟進入手機設置功能,選擇安全和隐私功能,點擊進入。向下滑動查找,找到應用鎖...
2025-12-07
Copyright 2023-2025 - www.tftnews.com All Rights Reserved