加入收藏 | 设为首页 |

黄秋燕-根据Python构建评级体系,精准掌握NY最具出资价值的地段

海外新闻 时间: 浏览:133 次

你,李铁锤,某地产公司剖析团队参谋,最近被老板奉告公司接下了一个新项目——通过数据查询纽约城中最具出资价值的地段。

你心里欢喜的一起发现这对你来说完全是史黄秋燕-根据Python构建评级体系,精准掌握NY最具出资价值的地段无前例的应战,因为......你对其间技能操作一窍不通(凉凉)。

可是你却不甘于此,活跃寻觅方法想要一举成名。

所以一天你走在路上时无意间发现,江湖中早已有人打造了整套的API秘笈。

那么问题就来了:

1

什么是API?

知乎上有人说:关于许多非IT人士而言,API ≈ 听不懂(为难而不失礼貌的浅笑)。

再看百度百科给出的解说是这样的:

API(Application Programming Interface,使用程序接口)是一些预黄秋燕-根据Python构建评级体系,精准掌握NY最具出资价值的地段先界说的函数,或指软件体系不同组成部分联接的约好。

意图是供应使用程序与开发人员依据某软件或硬件得以拜访一组例程的才能,而又无需拜访原码,或了解内部作业机制的细节。

看完今后似懂非懂,那咱们先上图。

依据上图可知,API就相当于用户和数据库之间的衔接(也便是咱们所说的接口)。

咱们举个物流职业的栗子,假定数据库是库房,那么手机App便是商铺,用户便是购物的顾客。

当顾客想购买产品时,他不行能直接去库房里购买,一起店员也不行能直接去库房取货;就黄秋燕-根据Python构建评级体系,精准掌握NY最具出资价值的地段算去了,因为自身对库房货品摆放方法不行了解,顾客和店员都很难找到所需的产品。

此刻,就需求中转站作业人员调货分配打包交给店员。

至此问题就完美地处理了(此处应有掌声)!

但事实上,要完结API使用在技能层面远比这个杂乱许多,每一个环节都必不行少,每一个要素都不行切分。

那在API谋福用户前,要通过怎样绵长的发明进程呢?这个进程中的每一环又需求哪些必备技能呢?接着往下看。

2

怎么完结API?

那么怎么完结把那个封装一套完好的地产数据相关的API并供应给剖析团队,你有必要阅历以下过程:

首要通过商业剖析选定原始数据,然后使用python为根底语⾔言进⾏数据清洗并通过多种机器学习模型进行练习,再使用Tableau等可视化软件完结数据可视化,终究对⽤户完结reference data API。

从上文咱们能够提炼出几个要害词及其各自的效果:

商业剖析——选取原始数据

python——数据清洗

机器学习——进行练习

Tableau——数据可视化

这些要害词也别离对应本项目包括的几个要害模块:

1. 商业模型调研

  • 剖析用户需求,编撰商业提案(business proposal),树立商业问题(business problem)– in Do黄秋燕-根据Python构建评级体系,精准掌握NY最具出资价值的地段c
  • 搭建和安装好一切需求的软件和权限,例如 Github, Spark platform, Tableau等
  • 样本数据(sample data)以及一切原始1981年属什么初数据的搜集– in Cloud

2. 数据清洗及探究

  • 依据需求迭代清洗原始数据
  • 要素剖析,选取有用特征,增加必要特征,降维度,确认猜测⽬方针等等
  • 探究性数据剖析
  • 学习怎么设置集群(cluster),了解⼤大数据运⾏行原理

3. 试验并选定机器学习模型

  • 模型的研讨以及移送剖析
  • 树立模型(回归/分类/聚类剖析)
  • 练习及优化模型: 调参,精确度,混杂矩阵(confusion matrix)

4. 项意图完结和布置

  • 项意图完结和完善
  • 项目制品review以及总结报告
  • 项目阅历的完善以及后期规划

整个实习项⽬3-5⼈小组,首要语⾔为Python,HBO 数据科学家带队,协作线上解说,以及平常答疑

项⽬内容包括了Data Scientist实在完好的日常作业流程

近距离触摸HBO相关数据剖析项⽬流程

使用Python亲身完结⼀套数据剖析产品,以及实践的数据处理方案

取得提高简历Project Experience的绝佳时机

获取更多更优质求职⾯试时机,优异学员可取得导师推荐信乃至内推时机

Julie

HBO数据科学家

美国商业剖析硕士

现在从事HBO的Data Scientist作业

通晓数据Pipeline规划及数据剖析

通晓Machine Learning及模型优化

通过这一番练习,老板的任何要求你都能够handle住,安稳无忧,前程似锦了。

协作院校