-
将每个人物打上一个独有的标签
-
对于每轮迭代,统计A的所有邻居的标签,选择权重和最大的一个作为A的新标签。
- 例如,若A的邻居为 B 0.1|C 0.2|D 0.7,其中B和C的标签为1,D的标签为2,则标签1的权重和为0.3,标签2的权重和为0.7,A的新标签为2
-
进行若干轮迭代
在hdfs下跑:
yarn jar xxx.jar org.GetNames.GetNames PATH/PERSON_LIST_TXT YOUR_INPUT_FOLDER_PATH YOUR_OUTPUT_PATH
在本机跑:
java org.GetNames.GetNames PATH/PERSON_LIST_TXT YOUR_INPUT_FOLDER_PATH YOUR_OUTPUT_PATH
在hdfs下跑:
yarn jar xxx.jar org.GraphFileGen.GraphFileGen YOUR_INPUT_FOLDER_PATH YOUR_OUTPUT_PATH
在本机跑:
java org.GraphFileGen.GraphFileGen YOUR_INPUT_FOLDER_PATH YOUR_OUTPUT_PATH
在hdfs下跑:
yarn jar xxx.jar org.PageRank.PageRankMain YOUR_INPUT_FOLDER_PATH YOUR_OUTPUT_PATH 迭代轮数
在本机跑:
java org.PageRank.PageRankMain YOUR_INPUT_FOLDER_PATH YOUR_OUTPUT_PATH 迭代轮数