Ymmärtäminen Hadoop Distributed File System John Karry

TheHadoop Distributed File System on täysin kannettava tiedostojärjestelmän, joka isalso jaetaan, sekä skaalautuva varten Hadoop puitteissa. On myös AFile järjestelmä, joka on kirjoitettu Java, että samassa yhteydessä. Kukin HDFScluster, joka kuuluu tähän tiettyyn tiedostojärjestelmä sisältää yhden nimen tilassa, sekä yksittäisen klusterin tietojen solmuja, jotka eivät aina tarvitse bepresent kussakin HDFS klusterin koko ajan. Tämä erityinen jaettu tiedostojärjestelmä on mitä tarjoaa säännöllinen pääsy sovelluksen tiedot, ja thisapplication tiedot on jotain, joka on aina sallittava tämä yhteys viathe portaalin kautta HDFS. Kukin tiedot solmu, joka on osa HDFS klusterin doesserve oma tehtävänsä; ja tämä tarkoitus on palvella lähinnä jatkuvaa korttelin ofdata verkon kautta käyttämällä uniikkia protokollaa, joka kuuluu vain theHDFS.

HadoopDistributed File System

käyttää TCP /IP-kerroksen voidakseen ulos itscommunications. HDFS voi tallentaa suuria tiedostoja, ja koko nämä tiedostot isequivalent karkeasti useita 64 MB. Asiakkaat, jotka eivät halua communicatedirectly kanssa HDFS on oltava RPC, joka on lyhenne sanoista Remote Procedure Callin jotta kommunikoida kunnolla. Suuria tiedostoja että HDFS voi siirtää Go tomultiple koneita samanaikaisesti.

Hadoop perustuu Java ja tukee theprocessing on suuria tietomääriä, kuten mitä löydämme Google. HadoopDistributed File System on täysin integrateddevelopment ympäristö

, jota käytetään paljon arvalla differentcompanies ja organisaatioiden sekä, tuotteita ja tehdä tutkimusta. Hadoopdistributed tiedostojärjestelmä on syy nopeaan tiedonsiirto solmujen välillä, siten sallien järjestelmän toiminnallinen keskeytyksettä, jos vika. Themain tämän järjestelmän soveltamisesta on ollut hakukoneiden ja advertisingonline.

Olkaamme ymmärtää logiikkaa HDFS. Se tallentaa largefiles jakamalla datan joukossa allas tietoja solmujen. Master /slavearchitecture käytetään tässä, jossa päällikkö määräysvalta yhdessä tai useammassa orjia. Theinformation noin data solmut tallennetaan yksittäisissä nimi solmuja, ja datanodes ovat yhteydessä toisiinsa, kuten klusterin. Käyttäjälle, se edustaa onesingle tiedosto. Hyöty HDFS on luotettava tallennusratkaisu largefiles. Perimmäisenä syynä luominen HDFS on luotettavuuden, vaikka pettäessä.