Skip to content
This repository has been archived by the owner on Sep 12, 2024. It is now read-only.

xixici/AlinkLearning

Repository files navigation

Alink Learning Alink学习实践指南

Alink生态图

Alink生态图

目的

为了学习Alink以及所涉及的Flink知识,本仓库有两大目的

首先,旨在使用scala实现Alink文档中提到的所有特性,包括但不仅限于以下:

  • 分类算法
    • 随机森林分类
    • 支持向量机
    • 决策树
    • 朴素贝叶斯方法
    • 多层感知机
    • gbdt二分类
    • softmax多分类
    • 逻辑回归
    • OneVsRest
  • 回归算法
    • gbdt回归
    • 线性回归
    • 随机森林回归
    • 保序回归
    • 广义线性回归
    • AFT生存回归
    • 决策树回归
    • Lasso回归
    • 岭回归
  • 聚类算法
    • 二分K均值聚类
    • KMeans
    • 高斯混合模型
    • LDA
  • 协同过滤
    • ALS
  • 异常检测
    • SOS
  • 关联规则
    • FP-Growth
    • PrefixSpan
  • 在线学习
    • ftrl
  • 特征工程
  • 模型的选择和调参
  • 模型的保存和加载

其次,本项目也包含了必要的Pom, Jar, 数据集以及官方示例。

  • Pom
    • pom.xml
  • Jar
    • alink_core-0.1-SNAPSHOT.jar
  • 官方数据集
    • adult_train & adult_test
    • iris
    • movielens_rating
    • review_rating_train
    • avazu-small
  • 自定义数据集
    • Mall_Costumers
    • 50_startups
    • lda-test-demo
    • FpGrowth-test-demo
    • PrefixSpan-test-demo
  • 官方jupyter notebook示例
    • adult.ipynb
    • ftrl_demo.ipynb
    • adult.ipynb
    • ftrl_demo.ipynb
    • kmeans.ipynb
    • mnist.ipynb
    • review_naive_bayes.ipynb
  • 官方Java示例
    • ALSExample.java
    • GBDTExample.java
    • KMeansExample.java

持续更新。。。。