Бивши служители на Yahoo и …
Новосъздадената компания Cloudera обяви официално пускането на своята дистрибуция на Hadoop – технология за паралелна обработка на големи масиви от данни с отворен код.
Новата дистрибуция е насочена към корпоративни потребители като Google, Yahooи и други, които обработват големи масиви от данни.
Cloudera, която бе създадена от ключови служители на Google, Yahoo, Oracle и Facebook миналата година, ще осигурява още и поддръжка на Hadoop за своите клиенти.
„Докато работехме с наши клиенти, много често чувахме мнения, че конфигурирането и внедряването на Hadoop е много тежък процес”, обяснява Кристоф Бисиглиа, служител в Cloudera и една от основните фигури в Google. Той смята, че Hadoop трябва да може да се конфигурира, внедрява и управлява, както и всеки друг софтуер.
Това е и причината за решението на Cloudera да пусне своята дистрибуция, която е достъпна, както като RPM пакет за системи, работещи с Red Hat Linux, така и като “image” за Amazon’s Elastic Compute Cloud (EC2).
Решението се разпространява безплатно, съгласно лиценза Apache 2. С пускането на пакета, от Cloudera без съмнение очакват да нарасне броят на клиентите, ползващи Hadoop, и съответно имащи нужда от услугите на Cloudera по поддръжка. Все още от компанията не са обявили цените за поддържка.
Дистрибуцията на Cloudera има 3 основни компонента: “Hadoop distributed file system”, която може да работи на стандартни машини; имплементация на “MapReduce framework”, оригинално разработена от Google за паралелна обработка на големи масиви от данни; и “Hive” – “datawarehouse” слой, който използва SQL-базирания HQL език.
