Coder Social home page Coder Social logo

hadoop_labs's Introduction

Installing Hadoop

Установим рандомные пакеты:

sudo apt install mc wget curl ssh rsync screen make ssh openssh-server

Скачаем Hadoop 2.10.2:

wget http://mirror.linux-ia64.org/apache/hadoop/common/hadoop-2.10.2/hadoop-2.10.2.tar.gz

Распакуем:

tar -xvf hadoop-2.10.2.tar.gz

Подключаем репозиторий в /etc/apt/sources.list

deb http://deb.debian.org/debian/ unstable main contrib non-free

Устанавливаем java:

sudo apt install openjdk-8-jdk openjdk-8-jre

Далее уберем из /etc/apt/sources.list добавленный ранее репозиторий. Добавим в конец файла /etc/profile следующие строки:

JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
HADOOP_HOME=$HOME/hadoop-2.10.2
PATH=$PATH:$HADOOP_HOME/bin:$JAVA_HOME/bin
export HADOOP_HOME
export JAVA_HOME
export PATH

После перезапуска сессии эти изменения применятся и обновленные переменные окружения будут доступны в env:

env

Настроим беспарольный доступ по ssh к своем же машине:

ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

Настройка Hadoop

В файл hadoop-2.10.2/etc/hadoop/core-site.xml вносим следующее:

<configuration>
    <property>
            <name>fs.defaultFS</name>
            <value>hdfs://localhost:9000</value>
    </property>
    <property>
            <name>hadoop.http.staticuser.user</name>
            <value>user</value>
    </property>
</configuration>

В файл hadoop-2.10.2/etc/hadoop/hdfs-site.xml вносим следующее:

<configuration>
    <property>
            <name>dfs.replication</name>
            <value>1</value>
    </property>
</configuration>

В файл hadoop-2.10.2/etc/hadoop/mapred-site.xml вносим следующее (предварительно его нужно создать на базе hadoop-2.10.2/etc/hadoop/mapred-site.xml.template):

<configuration>
    <property>
            <name>mapreduce.framework.name</name>
            <value>yarn</value>
    </property>
</configuration>

В файл hadoop-2.10.2/etc/hadoop/yarn-site.xml вносим следующее:

<configuration>
    <property>
            <name>yarn.nodemanager.aux-services</name>
            <value>mapreduce_shuffle</value>
    </property>
</configuration>

Также понадобятся скрипты из архива scripts.tar.gz на Google Drive, архив надо распаковать и переместить все файл в ~bin, например так:

tar -xvf scripts.tar.gz && sudo cp *.sh ~bin/

Дополнительно понадобится пропатчить скрипты Hadoop. в libexec/hadoop-config.sh нужно следующее:

# Attempt to set JAVA_HOME if it is not set
if [[ -z $JAVA_HOME ]]; then
  # On OSX use java_home (or /Library for older versions)
  if [ "Darwin" == "$(uname -s)" ]; then
    if [ -x /usr/libexec/java_home ]; then
      export JAVA_HOME=($(/usr/libexec/java_home))
    else
      export JAVA_HOME=(/Library/Java/Home)
    fi
  fi

  # Bail if we did not detect it
  if [[ -z $JAVA_HOME ]]; then
    echo "Error: JAVA_HOME is not set and could not be found." 1>&2
    exit 1
  fi
fi

Поменять на вот это:

# Attempt to set JAVA_HOME if it is not set
if [[ -z $JAVA_HOME ]]; then
  # On OSX use java_home (or /Library for older versions)
  if [ "Darwin" == "$(uname -s)" ]; then
    if [ -x /usr/libexec/java_home ]; then
      export JAVA_HOME=($(/usr/libexec/java_home))
    else
      export JAVA_HOME=(/Library/Java/Home)
    fi
  fi
  export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64

  # Bail if we did not detect it
  if [[ -z $JAVA_HOME ]]; then
    echo "Error: JAVA_HOME is not set and could not be found." 1>&2
    exit 1
  fi
fi

После чего запускаем скрипт форматирования:

hdpFormat.sh

Далее запускаем уже сам Hadoop:

hdpStart.sh

Web-интерфейс доступен по адресу: http://192.168.122.8:50070

hadoop_labs's People

Contributors

hermainy avatar sunforgb avatar

Watchers

 avatar

Forkers

kuzma012345

hadoop_labs's Issues

shit

code is not working, andrey cant test, go refactor

изменить код генерации

Необходимо изменить код генерации списка товаров в Faker.py.
В первую очередь изменить название исходника.
Во вторую очередь - поменять на list/dict comprehensions.
Третье - необходимо инициализировать random сидом, чтобы числа генерировались на основании всегда разного числа.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.