联系客服
客服二维码

联系客服获取更多资料

微信号:LingLab1

客服电话:010-82185409

意见反馈
关注我们
关注公众号

关注公众号

linglab语言实验室

回到顶部
数据库入门

188 阅读 2020-07-29 11:30:03 上传

以下文章来源于 语料数据库



(图片来自Google)


21世纪是信息经济的时代。数据科学家和分析师帮助企业做出基于数据的关键决策,以最大化公司利润和提升产品性能。不管是利用历史销售数据帮助公司预测产品的需求趋势,还是帮助当地政府确定火车站的选址,你都会用到多种不同的数据来源,比如销售记录、道路交通图片、天气传感器的读取数值等等。因此,许多商业和开源的数据库系统得以开发,用来满足多样化数据格式的存储需求。本文将系统宏观的介绍最为普遍的数据库系统以及每类数据库最流行的使用案例。此文还将为你学习数据库系统提供建议。

首先,我们需要对数据库系统给出定义。所谓数据库,是一种计算机系统,旨在帮助其用户快速并安全有效地维护、更新和编辑存储的信息。数据库系统于1970年开始大规模流行,关系型数据库管理系统(relational database management system,简称RDBMS)的引入,使数据可以存储在有结构的框架下,并以行与列的表格形式呈现。在过去很长一段时间,比较流行的关系数据库管理系统有Oracle(甲骨文),Microsoft SQL Server(微软SQL服务器),以及其他开源的应用软件,如MySQL,它们都利用大众的结构化查询语言(Structured Query Language,简称SQL)提供可靠的数据处理功能,只需简单的指令就可以对数据进行读取、建立、更新和删除。因此,掌握SQL语言被认为是数据科学家和分析师最重要的技能之一。尽管如此,近几年,随着多样化数据格式的不断出现,许多非关系型数据库系统也开始广泛使用起来,以满足非传统数据格式的需求。


(图片来自Google)

虽然关系型数据库为我们提供了保存和处理结构数据格式的灵活性和便利,但许多其他的应用则依赖于非结构性数据,如社交媒体上发布的帖子,物联网的传感器,手机应用网络收集的数据。非结构化数据(NoSQL)通常并不遵循明确的架构,不能简单的储存在传统的关系型数据库系统中。正因为如此,许多非关系数据库系统得以开发,对无需架构的数据形式进行灵活的存储和提取。一些比较大众的非关系型数据库系统,包括Neo4j,一种以图为导向的数据库和Elasticsearch,一种以文本为导向的数据库。这些数据库系统逐渐成为基于大数据进行数据分析和人工智能算法的不可或缺的部分。


(图片来自Google)


了解了不同类型的数据库及其应用后,你可能在想应该学习哪一个。虽然非关系型数据库的解决方案在快速发展,但大部分数据仍然储存在传统结构的数据库中。关系型数据库管理系统的长期历史使SQL语言早已成为行业内的标准。一旦你对关系数据库和SQL语言有了一定的认识和理解,以后评估非关系数据库解决方案以及跨平台掌握数据都会变得容易。

点赞
收藏
表情
图片
附件