1、科大讯飞AI研究算法工程师-智能语音方向招聘要求

1.1 任职要求

(1)重点院校硕士及以上学历,计算机、信号处理、自动化、应用数学等相关专业,具备一定的数理统计、模式识别、图像处理等理论知识;

(2)熟悉常见深度学习算法和理论,熟练掌握至少一种常见的深度学习框架(Pytorch、TensorFlow等);

(3)具备较好的C/C++或Python编程能力,熟悉数据结构、Linux操作系统等,有一定的代码开发经历,能够快速实现相关算法;

(4)从事过A.I.相关的研发任务,包括研究论文发表、研发项目经历等。

1.2 如果你具备以下条件,我们将优先考虑:

(1)在人工智能会议(包括但不限于ACL、COLING、IJCAI、AAAI、ICLR、NIPS、CVPR、ICCV、InterSpeech、ICASSP)或期刊上发表过文章;

(2)在Kaggle、天池等国内外知名评测任务或比赛中成绩优秀者;

(3)在智能语音、计算机视觉、自然语言处理等相关方向有较丰富的实际系统研究和开发经验者

2、在Kaggle、天池等国内外知名评测任务或比赛中成绩优秀者

如何满足科大讯飞AI研究算法工程师

Kaggle由安东尼·高德布卢姆(Anthony Goldbloom)在澳大利亚墨尔本创立,主要为开发商和数据科学家提供机器学习竞赛、托管数据库、编写和分享代码的服务。这个平台已经吸引了超过80万名数据科学家的关注,并在2017年被谷歌收购。

2.1.1 如何在Kaggle上找到适合初学者的竞赛

访问Kaggle网站:首先,您需要访问Kaggle的官方网站(www.kaggle.com)并注册一个账号。

浏览竞赛页面:在网站上,导航到“Competitions”部分,这里列出了所有正在进行的竞赛。

筛选竞赛:使用页面上的筛选工具,可以根据竞赛的不同特征进行筛选,比如奖金、类型、技能级别、结束日期等。

查找初学者竞赛:在筛选时,可以查找特别标记为“Getting Started”或“101”的竞赛。这些竞赛通常设计得比较简单,适合初学者入门。

阅读竞赛描述:对于列出的每个竞赛,仔细阅读竞赛描述,了解竞赛的目标、提供的数据集和预期的输出。初学者应该寻找那些描述清晰、目标明确的竞赛。

查看数据集:检查提供的数据集。初学者适合的竞赛通常数据集较小、清洗得较好,不需要复杂的预处理。

参与人数:查看已经参与的队伍数量。通常,参与人数较少的竞赛可能是因为它们更适合初学者,因此没有吸引到很多高级数据科学家。

论坛讨论:访问竞赛的论坛页面,看看其他参赛者的讨论。初学者可以在论坛中提问,也可以通过其他人的讨论来了解竞赛的难度和挑战。

选择竞赛:根据上述信息,选择一个看起来适合您当前技能水平的竞赛。

开始参与:一旦选择了竞赛,就可以开始阅读竞赛规则,下载数据集,并开始构建您的模型。

2.1.2 在Kaggle上找个初学者适合的竞赛开练

泰坦尼克号生存预测(Titanic):这是一个经典的入门级竞赛,主要任务是预测哪些乘客在泰坦尼克号沉船事故中幸存。这个数据集包含891个训练样本和10个特征,非常适合初学者熟悉Kaggle平台及竞赛方式。

房价预测(House Prices):这个竞赛是一个回归问题,要求参与者使用79个特征来预测爱荷华州埃姆斯城住宅的房价。这是一个有趣的比赛,可以帮助参与者提升特征工程技能。

森林覆盖类型预测(Forest Cover Type Prediction):在这个分类问题中,参与者需要预测30×30米森林单元中的主要树木覆盖类型。数据集包含15120个训练样本和54个特征,是一个7类分类问题,适合有一定基础的学习者。

不要过度拟合!Ⅱ(Don’t Overfit! ΙΙ):这个竞赛的挑战是在只有250个训练行和300个特征的情况下,预测19750行数据,旨在提高参与者减少过度拟合的技能。

分类特征编码挑战(Categorical Feature Encoding Challenge):这场比赛专注于分类特征,包含300000行和23个特征,让参与者有机会使用不同算法的不同编码方案,并比较它们的表现。

共享单车需求预测(Bike Sharing Demand):这个竞赛要求参与者结合历史使用情况和天气数据,预测华盛顿地区共享单车计划中的自行车租赁需求。

2.2 阿里云天池:最前沿的AI赛题和课程

阿里巴巴集团主办的一个大数据竞赛平台。它类似于Kaggle,提供了一个平台,让数据科学家和开发者可以参与各种数据挖掘和机器学习竞赛。天池竞赛通常涉及解决实际问题,如预测用户行为、优化物流路线、图像识别等。

2.2.1 如何在阿里云天池上找到适合初学者的竞赛

访问天池官网:首先,您需要访问天池平台的官方网站(tianchi.aliyun.com)并注册一个账号。

基础学习:如果基础较薄弱,可以从天池的AI课程开始,这些课程从入门到进阶都有涵盖,适合不同水平的参赛者。

参与学习赛:天池有零基础入门系列学习赛,配套有教程、baseline和视频讲解,对新手非常友好。

利用资源:天池实验室提供免费的计算资源,包括CPU和GPU,方便新手进行数据分析和建模预测。

观摩学习:通过观看历届大赛的答辩视频,理解比赛的决赛视频,可以学习到大佬们的分享和思路。

逐步提升:从简单的学习赛开始,逐步提升难度,参加更高级别的比赛,如算法赛。

2.3 DrivenData:建设更美好的世界,用最先进的预测模型来解决世界上最棘手的问题

DrivenData专注于举办数据科学竞赛的组织,旨在将数据科学和人工智能的力量应用于解决现实世界中的社会挑战。

DrivenData分为有奖比赛、练习赛,新手可以从练习赛,如下图:

3、其他相关内容

竞赛日历-Coggle数据科学:包括国内外大多数数据科学的比赛,今日比赛截图如下: