avatar avatar 我的文献 自然语言生成多表SQL查询语句技术研究 作者 曹金超; 黄滔; 陈刚; 吴晓凡; 陈珂 单位 浙江大学计算机科学与技术学院; 浙江邦盛科技有限公司; 浙江大学浙江省大数据智能计算重点实验室; 网易(杭州)网络有限公司 期刊 计算机科学与探索 时间 关键词 自然语言; SQL查询生成; 多表; 模板填充; 深度学习 基金 国家重点研发计划(No.2017YFB1201001); 国家自然科学基金资助项目(No.61672455); 浙江省自然科学基金资助项目(No.LY18F020005)
摘要
自然语言生成SQL查询不仅是构建智能数据库查询系统的一个重要组成部分,亦是新型供电轨道交通系统混合时态大数据个性化运维的难点之一。目前利用深度学习模型的方法专注于数据库中单表SQL查询生成,都无法解决数据库中多表SQL查询生成。针对这个问题,本文采用一种基于SQL语句模板填充的方法,将序列生成问题转化为多个分类问题,在训练深度学习模型的过程中充分利用SQL子句不同预测成分之间的依赖关系。在FROM子句的多表JOIN路径生成方面,将其建模为斯坦纳树(Steiner Tree)问题,采用一种全局最优的算法来进行求解。在一个开放的文本生成SQL数据集Spider上对模型和算法进行实验验证,实验结果验证了本文的方法能有效地提升多表SQL查询生成的查询匹配准确率(Query-match Accuracy)。
下载 浏览 cnki {{liketext}}
©2020 - iData {{ message }} 关闭