专业的IT培训机构|腾科IT教育集团
复制成功
微信号:togogoi
添加微信好友, 详细了解课程
已复制成功,如果自动跳转微信失败,请前往微信添加好友
打开微信
图片

腾科新闻

听说你也在做AI,这里的四个坑千万别踩!

发布时间: 2017-06-21

  人工智能越来越热,想要在人工智能领域创业的人也随之涌入,但在人工智能领域创业,有很多需要注意的地方。现在腾科小编整理了一些宝贵建议给想要深耕人工智能的创业者们,一起来看。
​​
  机器学习实在太受欢迎,以至于它都被当做了AI本身,热度更高的深度学习更是如此。令人高兴的是你的创业团队已经获得了资金或者你的团队预算刚刚获得了通过,现在你即将开始进入深度学习领域。可是,当你真的要在商业上开始实践人工智能的时候,那么有几件事是你必须要考虑的。接下来,小编会结合几个例子来阐述我的建议。
​​
  1、别让数据和工程师脱节

  深度学习是一项数据先行的科学。你的团队或者创业存在的全部意义就是为了让这些数据变得有意义。想想看,你只有将文字变得有意义,你才能研发你的人工智能!你只有理解图像、视频等内容,你才能打造下一个SnapchatStories式的自动化多媒体拼贴。你应该把数据处理当做你工作的一个核心。一定要在这方面做好它。例如如果你觉得“只需要15分钟”来准备和加载数据集,那么每次当你发现了更好的模型架构或者在你的Tensorflow代码中发现了漏洞的时候,都必须要白白浪费这15分钟的时间。规则很简单。版本化你的数据集,并且预处理一次,之后反复使用。一些类似Celery、Luigi这样的工具会是你的好帮手。如果你是在一个大型的团队工作,团队中的所有任务都需要提交到一个集群,这时应该考虑一个数据解决方案,向模型训练的员工批量提供数据。千万千万不要让团队中的成员在已经知道模型有漏洞的情况下,还必须等到整个数据集都加载完毕才能修改。

  2、从你能可视化的东西开始

  对深度学习而言,我们很幸运有Tensorboard、Visdom以及其它的一些工具来帮我们可视化结果。小编相信数据科学一般来说是最适合可视化驱动开发的,因为可视化让研发的每一步都能正确处理所遇到的问题。没有必要非得学习d3.js来获得有用的可视化,除非你是JavaScript的狂热爱好者。

  3、尽早明确你的验证/疑难案例数据集

  小编把充满乐趣的可视化内容放在第二位,是为了让你被“准备数据”吓到之后,能稍作休息。可是,如果想避免成为一只打字机上的猴子,只会随机往神经网络上添加更多的层,就必须要学会如何衡量进度。问问自己哪些指标与优秀的可交付成果的相关性更好以及你应该跟踪哪些数据。这或许超过了简单的“随机验证10%的剩余数据”。验证的数据库最好与产品拥有相同的统计属性。同样的产品也能被用于追踪疑难、边缘甚至失败的案例,以制作未来的验证集。因此,你的验证集或许会不断发展,而且应该像训练集一样进行版本化。

  4、过早的扩张是早期创业公司倒闭的主要原因

  听到这个建议,有人也许会说“别试着教我这些,我听过的创业故事肯定比你多!”诚然,但这里要告诉各位的新事物是应该把GPU和硬件训练当成和员工同样的因素来考虑。一旦雇佣/购买了超过你所需要的,你将花费很多的精力来安排多出来的资源。管理集群会很困难,而且深度学习的大规模HPC本身就是一个研究课题。小编的建议是在够买一个新的GPU之前,应该保证现有的GPU都被充分利用。当你然可以像Google一样大手大脚,前提是你的生产力和盈利能力能像Google一样。如果你的团队和公司已经足够大,要严肃认真的招聘那些在基础设施上工作的员工。如果你雇佣了十倍于硬件员工人数的研究人员,却让他们被迫等待,那么最好的情况是他们自己建立适合自己的基础设施,最坏的情况则是他们干脆直接退出。这肯定不是你想见到的状况。

  没错!在人工智能领域工作既富挑战性,又充满了乐趣。确保你对如何处理资源和可视化有一定的思考,那么你会没事的。

上一篇: 学习Oracle数据库入门经验分享

下一篇: 对于以CCIE为目标的网络工程专业大学生,您的最好的建议是什么?

在线咨询 ×

您好,请问有什么可以帮您?我们将竭诚提供最优质服务!