通讯、书籍、消息、短信,歌曲,电影……我们每天要面对非常多的文本和语音数据,自然语言处理(NLP)要做的就是理解这些数据并做一些有趣的事情。作为人工智能的一种应用程序,自然语言处理赋予机器阅读、理解人类语言的能力,并从人类语言中获得意义。

目前为止,自然语言处理的应用分布于多个领域,且通过其细化技术任务的多种组合,使自然语言处理的应用成功落地法律、新闻、医疗、金融、娱乐等多种应用场景。擎盾“小法管家”就是依托了强大的LawBrain问答引擎和专业的法律知识图谱,使用NLU、深度学习等人工智能前沿技术,为广大人民群众提供专业的法律服务,让法律触手可及。
想知道自然语言处理还有哪些魅力吗?
小法这就满足大家~
9月28日,北京大学软件工程国家工程研究中心副教授叶蔚联合擎盾数据采取线下+线上相结合的形式,为大家带来一场别开生面的培训交流,为擎盾数据的工程师们的日后工作带来了全新启发。
▲叶蔚副教授▲
在擎盾数据的开发研究中,会利用自然语言处理、文本挖掘和文本分析等技术来发现经常隐藏在大量数据中的关键点,或者看起来不相关但经过规模化分析后有价值的关键点,以发掘法律案件等的战略增长和经常性变化趋势,从而帮助法律从业人员在更快时间内做出更为明智的决策。
法律行业中的自然语言处理一般涉及到电子数据展示中的信息检索、合同管理、条款摘要等等。电子数据展示中的信息检索涉及的是电子版的法律诉讼过程中发现、查找数据,例如起诉、政府调查等过程。自然语言处理可以帮助法律从业人员快速寻找所需文件;在合同管理中,自然语言处理能够提取金额、日期等关键信息,总结合同中的条款形成报告,还可以出于风险评估、预算和计划等目的去比较所有条款;在条款摘要中,自然语言处理可以帮助法律从业人员总结概括法律文件、生成摘要,从而更好地理解文件全部内容。
本次交流会中
与会的技术小哥哥、小姐姐们感受如何?
小法采访到现场的一位算法工程师!
算法工程师 刘策
本次培训会为我们带来了很多启发,聆听后收获颇丰。叶蔚老师先从“明知识”“暗知识”的维度讲起,对深度学习中的不同模块进行了知识层面的界定;介绍了自然语言处理技术发展的四个阶段,自Transformer模型和BERT面世后的现阶段,预训练模型成为了自然语言处理领域的首选。具有强大表征能力的预训练语言模型依旧是可预见的未来最强大的自然语言处理方法。在我司业务中,凡涉及到NLP的业务部分,或多或少都会与预训练模型打交道,比如我正在做的法律文书语义检索,就需要用到BERT、electra等预训练语言模型来获取裁判文书、用户query等的语义表征。
未来,擎盾数据将携手更多如同叶蔚副教授这样的高科技人才,为大家输出更多知识干货、帮助同事们提升专业水平,推出更多高价值的产品,在法律AI长河中众擎易举、共建共享!
-END-
审 核 ‖ 杜向阳 梁雁圆 杨 雷
责 任 编 辑 ‖ 文浩
文 案 编 辑 ‖ 杨玲玲


还没有评论,来说两句吧...