“ 木桶水量取决于最短的那块木板 ” — 数据库设计、优化与大批量数据处理 张志翔 中国科学技术大学 - 瑞士弗里堡大学 信息物理联合实验室 2010.10.

Slides:



Advertisements
Similar presentations
首 页 首 页 上一页 下一页 本讲内容 投影法概述三视图形成及其投影规律平面立体三视图、尺寸标注 本讲内容 复习: P25~P31 、 P84~P85 作业: P7, P8, P14[2-32(2) A3 (1:1)]
Advertisements

纺纱学. 2 绪 论 基本要求:了解纺纱系统的类别 重点掌握:棉纺系统的工艺流程 3 一、纺纱原理与设备 纺纱:用物理或机械的方法将纺织纤维纺成纱 线的过程。 纺纱原理:初加工、原料的选配、开松除杂、 混和、梳理、精梳、并合、牵伸、加捻、卷绕等。 纺纱方法:传统纺纱方法、新型纺纱方法。 纺纱设备:开清棉联合机、梳棉机、精梳机、
一、统计范围 注册地在湖里区的具有房地产开发资质的 房地产开发企业 无论目前是否有开发项目 无论开发的项目是在湖里区还是在其他区 没有开发项目的企业需要报送年报和月报 中的资金表(空表)。 新成立的项目公司,要先入库,再报报表。
第十二章 常微分方程 返回. 一、主要内容 基本概念 一阶方程 类 型 1. 直接积分法 2. 可分离变量 3. 齐次方程 4. 可化为齐次 方程 5. 全微分方程 6. 线性方程 类 型 1. 直接积分法 2. 可分离变量 3. 齐次方程 4. 可化为齐次 方程 5. 全微分方程 6. 线性方程.
退 出退 出退 出退 出 上一页 下一页 仪器使用 §1-2 尺规绘图工具和仪器的使用方法 图板丁字尺三角板 比例尺圆规分规铅笔曲线板。 要提高绘图的准确度和绘图效率,必须正确地使用各种绘图工 具和仪器。常用的手工绘图工具和仪器有图板、丁字尺、三角板、 比例尺、圆规、分规、铅笔、曲线板等。 提示:将光标放在仪器上,
概率统计( ZYH ) 节目录 3.1 二维随机变量的概率分布 3.2 边缘分布 3.4 随机变量的独立性 第三章 随机向量及其分布 3.3 条件分布.
PHPCMS 使用指南及二次开发向导 --- 系统设置篇 PHPCMS 网络培训课程 --- 系统设置篇 PHPCMS 项目部 王官庆制作 系统相关设置 1. 站点管理 2. 发布点管理 3. 系统其它设置 管理员设置 1. 角色定义 2. 管理员管理.
石化的 IT 大挑战 洛阳石化工程公司. 石化公司简介 中国石化集团洛阳石油化工工程公司,是国内能源化 工领域集技术专利商与工程承包商于一体的高科技企 业。拥有中国综合设计甲级资质,为国家首批业务涵 盖 21 个行业的工程咨询企业之一,拥有工程总承包、 工程设计、工程监理、工程咨询和环境影响评价等甲.
HistCite 结果分析示例 罗昭锋. By:SC 可能原因:文献年度过窄,少有相互引用.
位置相关查询处理 研究背景及意义 移动计算、无线通信以及定位技术的快速发展,使 得位置相关的查询处理及基于位置的信息服务技术 已经成为一个热点研究领域 。 大量的应用领域 ( 如地理信息系统、智能导航、交 通管制、天气预报、军事、移动电子商务等 ) 均迫 切需要有效地查询这些数据对象。
2011 年 2 月 产品介绍. 产品介绍 产品目标 产品目标 系统功能特性 系统功能特性 技术特点 技术特点 部署方式 部署方式.
一、拟合优度检验 二、变量的显著性检验 三、参数的置信区间
计算机 在分析化学的应用 ( 简介 ) 陈辉宏. 一. 概述 信息时代的来临, 各门学科的研究方法都 有了新的发展. 计算机的介入, 为分析化学的进展提供了 一种更方便的研究方法.
编译程序 构造原理和实现技术 授课教师:吕江花. 第一章 编译程序概述 主要内容: 几个基本概念 编译器的工作过程概述 编译器各个阶段的功能描述 编译程序的实现途径.
地理信息系统概述. 数据和信息 (Data & Information) 数据 原始事实 如:员工姓名, 数据可以有数值、图形、声音、视觉数据等 信息 以一定规则组织在一起的事实的集合。
第 4 章 抽象解释 内容概述 以一种独立于编程语言的方式,介绍抽象解释的 一些本质概念 – 将 “ 程序分析对语言语义是正确的 ” 这个概念公式 化 – 用 “ 加宽和收缩技术 ” 来获得最小不动点的较好的 近似,并使所需计算步数得到限制 – 用 “ 伽罗瓦连接和伽罗瓦插入 ” 来把代价较大的属 性空间用代价较小的属性空间来代替.
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第六十二讲 ) 离散数学. 最后,我们构造能识别 A 的 Kleene 闭包 A* 的自动机 M A* =(S A* , I , f A* , s A* , F A* ) , 令 S A* 包括所有的 S A 的状态以及一个 附加的状态 s.
数字图书馆 最新技术及发展趋势介绍. 中国高等教育文献保障系统 China Academic Library & Information System 第2页第2页 什么是数字图书馆技术? 技术: 人类改变或控制客观环境的手段或活动。 构建数字图书馆的技术。
1 为了更好的揭示随机现象的规律性并 利用数学工具描述其规律, 有必要引入随 机变量来描述随机试验的不同结果 例 电话总机某段时间内接到的电话次数, 可用一个变量 X 来描述 例 检测一件产品可能出现的两个结果, 也可以用一个变量来描述 第五章 随机变量及其分布函数.
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第三十八讲 ) 离散数学. 第八章 格与布尔代数 §8.1 引 言 在第一章中我们介绍了关于集 合的理论。如果将 ρ ( S )看做 是集合 S 的所有子集组成的集合, 于是, ρ ( S )中两个集合的并 集 A ∪ B ,两个集合的交集.
协同工作环境研究中心 协同共享 助力科研. 主要内容  认识协同及协同软件  协同科研软件 duckling 介绍.
线性代数习题课 吉林大学 术洪亮 第一讲 行 列 式 前面我们已经学习了关 于行列式的概念和一些基本 理论,其主要内容可概括为:
第 4 章 过程与变量的作用范围. 4.1 Visual Basic 的代码模块 Visual Basic 的应用程序是由过程组成的, 过程代码存放在模块中。 Visual Basic 提供了 三类模块,它们是窗体模块、标准模块和类 模块。 窗体模块 窗体模块是大多数 Visual Basic.
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 3 章 曲线拟合的最小二乘法 给出一组离散点,确定一个函数逼近原函数,插值是这样的一种手段。 在实际中,数据不可避免的会有误差,插值函数会将这些误差也包括在内。
聚合物在生物高分子分离中的应用 王延梅 中国科学技术大学高分子科学与工程系 Tel
数据库与智能网络研究室. © htttp://dbin.jlu.edu.cn 数据库系统原理复习大纲.
实验三: 用双线性变换法设计 IIR 数字滤波器 一、实验目的 1 熟悉用双线性变换法设计 IIR 数字滤波器的原理与方法。 2 掌握数字滤波器的计算机仿真方法。 3 通过观察对实际心电图信号的滤波作用, 获得数字滤波的感性知 识。
大亚湾 PMT 读出电子学介绍 王铮 中科院 “ 核探测技术与核电子学重点实验室 ” 年会.
外文文献检索示例. 实验目的: 掌握利用计算机网络检索外文文献的基本方法; 了解熟悉下列数据库的结构、内容并掌握其检索方 法 ; 掌握检索的主要途径:出版物( Publication )、关键 词( Keyword )、作者( Author )等。
1 第 7 章 专家控制系统 概述 专家系统的起源与发展 专家系统的一般结构 专家系统的知识表示和获取 专家系统的特点及分类.
信息利用与学术论文写作 Library of Jiangsu University, Zhenjiang Sha Zhenjiang
流态化 概述 一、固体流态化:颗粒物料与流动的流体接触,使颗粒物料呈类 似于流体的状态。 二、流态化技术的应用:流化催化裂化、吸附、干燥、冷凝等。 三、流态化技术的优点:连续化操作;温度均匀,易调节和维持; 气、固间传质、传热速率高等。 四、本章基本内容: 1. 流态化基本概念 2. 流体力学特性 3.
UML 对象设计与编程 主 讲 : 董兰芳 副教授 Dept. of Computer Science,USTC
东南大学计算中心 网站应用与实践 主讲人 吴俊. 2 东南大学计算中心 网站制作流程  确定主题、风格  规划栏目、收集素材  版面设计、配色  编辑页面  测试发布 FrontPage 要完成的任务.
第一节 相图基本知识 1 三元相图的主要特点 (1)是立体图形,主要由曲面构成; (2)可发生四相平衡转变; (3)一、二、三相区为一空间。
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第五十三讲 ) 离散数学. 定义 设 G= ( V , T , S , P ) 是一个语法结构,由 G 产生的语言 (或者说 G 的语言)是由初始状态 S 演绎出来的所有终止符的集合, 记为 L ( G ) ={w  T *
编译原理总结. 基本概念  编译器 、解释器  编译过程 、各过程的功能  编译器在程序执行过程中的作用  编译器的实现途径.
 符号表  标识符的作用: 声明部分:定义了各种对象及对应的属性和 使用规则。 程序体:对所定义的对象进行各种操作。 $ididname IdnameAttributeIR  必要性 Token : 新表-符号表(种类、类型等信息):
网上预约集港操作指南 一、登录系统 登陆下面图片显示网址:输入堆场用户名、密码和校验码登陆系统.
首 页 首 页 上一页 下一页 本讲内容本讲内容 视图,剖视图(Ⅰ) 复习: P107 ~ P115 作业: P48(6-2,6-4), P49( 去 6-6) P50, P51(6-13), P52 P50, P51(6-13), P52 P53 (6-18,6-20) P53 (6-18,6-20)
学生成长成才导图填报指南 填报网址:
《 UML 分析与设计》 交互概述图 授课人:唐一韬. 知 识 图 谱知 识 图 谱知 识 图 谱知 识 图 谱.
如何注册报名? “ 一师一优课、一课一名师 ” 操作解读 如何晒课? 如何注册报名?
电子商务实务 项目四 B2B 交易 目标 1 、了解 B2B 交易的基本流程 2 、熟练掌握平台 B2B 交易相关操作 3 、掌握电子商务技能鉴定培训平台交易大厅相关操作 4 、了解 B2B 的方式及其特点 5 、了解 B2B 平台的类型及其特点 6 、熟悉目前典型的 B2B 第三方支付平台及特点.
适用场景 应用背景 1 、企业使用电商平台作为前 台销售门户, NC 作为后台管 理软件; 2 、后台从商城平台自动定时 下载,快速导入到 NC 形成销 售订单,并按 ERP 业务规则 进行校验及触发后续流程; 3 、提高订单传递的及时性、 准确性、规范性,减少工作量, 降低出错率;
新一代移动物联系统 MC MOBILE CONTROL 开启办公物联网时代 Product Promotion.
本讲主要内容: 1. 如何登陆网站后台 2. 基础信息修改 3. 网站文章类型资料更新 4. 网站图片类型资料更新 5. 网站链接类型资料更新 本讲主要目的: 在结束本讲内容之后,能够按照客户的需求对网站的资料 进行实时更新操作。
Java 水晶报表. 目录 水晶报表开发 (CrystalReports 2008) Java 水晶报表 (JBuilder 2005) 报表项目布署 (WebSphere v6.1)
超星数字图书馆 一、页面的使用 进入数字图书馆网页 下载超星阅读器 查找图书.
2015 年江苏省美术专业统考考试说明 解读 : 贡加兵 扬州市邗江区公道中学
企业产品标准信息公共服务平台 操作介绍 目录 一 、系统架构介绍 二 、企业产品标准自我声明填报系统 三 、企业产品标准公示系统.
表单自定义 “ 表单自定义 ” 功能是用于制作表单的 工具,用数飞 OA 提供的表单自定义 功能能够快速制作出内容丰富、格 式规范、美观的表单。
力的合成 力的合成 一、力的合成 二、力的平行四边形 上一页下一页 目 录 退 出. 一、力的合成 O. O. 1. 合力与分力 我们常常用 一个力来代替几个力。如果这个 力单独作用在物体上的效果与原 来几个力共同作用在物体上的效 果完全一样,那么,这一个力就 叫做那几个力的合力,而那几个 力就是这个力的分力。
一个大学生眼里的移动互联网. file://\\ibhks021\halfway\Template Design by HK Presentation\POWERPOINT TEMPLATE\Dubai\Slide_v1.psd file://\\ibhks021\halfway\Template.
个体 精子 卵细胞 父亲 受精卵 母亲 人类生活史 问题:人类产生配子(精、卵 细胞)是不是有丝分裂?
“ 图书馆资源与服务利用 ” 专题讲座 第 9 讲 JSTOR 数据库与 Kluwer Online 数据库的使用.
逻辑设计基础 1 第 7 章 多级与(或)非门电路 逻辑设计基础 多级门电路.
“ 百链 ” 云图书馆. 什么是百链云图书馆?1 百链云图书馆的实际效果?2 百链云图书馆的实现原理?3 百链云图书馆的价值?44 图书馆要做什么?55 提 纲.
无忧 PPT 整理发布 无忧 PPT 整理发布 网上教研活动的推进与 学习社区的构建 首都师范大学 蒋国珍 2008 年 12 月.
目标与要求: 让学生了解材料美是布的基本特点,利 用布的特点进行创作,培养学生的创新和实 践能力。
森林保护学本科系列课程 教学改革与实践 西北农林科技大学 一、基本情况 二、主要成果 三、创新点 四、成果的应用 项目研究背景 项目的总体设计 成果简介 解决的主要教学问题 解决教学问题的方法 改革前后的对比.
1. 利用图形化开发环境 LabVIEW 对 Xilinx Spartan3E 进行编程 汤敏 NI 高校市场部.
张勤 人大报刊复印资料 专题全文数据库 简 介简 介 《人大报刊资料全文数据库》是中国人民大 学书报资料中心与北京博利群电子信息有限 公司联合开发研制的大型数据库光盘。它涵 盖面广、信息量大、分类科学、筛选严谨、 结构合理,是国内最具权威的社会科学、人.
欢 迎 使 用 《工程流体力学》 多媒体授课系统 燕 山 大 学 《工程流体力学》课程组. 第九章 缝隙流动 概述 9.1 两固定平板间的层流流动 9.2 具有相对运动的两平行平板 间的缝隙流动 9.3 环形缝隙中的层流流动.
迎接我们的未来 康 凯 教育部高等教育司. 以信息技术为代表的现代科技正在高 速实现着知识爆炸性的积累。 以信息技术为代表的现代科技正在高 速实现着知识爆炸性的积累。 知识总量的递增速度越来越快。 知识总量的递增速度越来越快。 知识创新周期越来越短。 知识创新周期越来越短。
1 第三章 数列 数列的概念 考点 搜索 ●数列的概念 ●数列通项公式的求解方法 ●用函数的观点理解数列 高考 猜想 以递推数列、新情境下的 数列为载体, 重点考查数列的通 项及性质, 是近年来高考的热点, 也是考题难点之所在.
北大法意数据库应用. 讲座提要大纲 法律专业能力 法律实践 法律信息检索能力 互联网 法律信息检索能力是法律专业人士的核心能力之一 美国律师协会( ABA )把它明确规定在律师的工 作规范和职业道德中.
韩文数据库使用说明 鲁锦松. 主要内容 一、为什么要用数据库 二、怎样利用中文数据库 三、怎样利用韩文数据库.
SCI 数据库检索练习参考 本练习完全依照 SCI 数据库实际检索过程而 实现。 本练习完全依照 SCI 数据库实际检索过程而 实现。 练习中,选择了可以举一反三的题目,读 者可以根据题目进行另外的检索练习,如: 可将 “ 与 ” 运算检索改为 “ 或 ” 、 “ 非 ” 运算检索 等等。 练习中,选择了可以举一反三的题目,读.
§7.2 估计量的评价标准 上一节我们看到,对于总体 X 的同一个 未知参数,由于采用的估计方法不同,可 能会产生多个不同的估计量.这就提出一 个问题,当总体的一个参数存在不同的估 计量时,究竟采用哪一个好呢?或者说怎 样评价一个估计量的统计性能呢?下面给 出几个常用的评价准则. 一.无偏性.
Presentation transcript:

“ 木桶水量取决于最短的那块木板 ” — 数据库设计、优化与大批量数据处理 张志翔 中国科学技术大学 - 瑞士弗里堡大学 信息物理联合实验室

本次培训介绍的内容 数据库设计  需求分析  E-R 图  表和字段的设计  选择键和索引  数据完整性设计 数据库优化  优化数据库结构  优化查询语句 大批量数据处理 NoSQL 介绍 2015/7/14 PHP & Web2.0 | Page 2

关系型数据库与 SQL 关系型数据库 RDBMS 就是由二维表及其之间的联系组 成的一个数据组织。 SQL(Structured Query Language) 结构化查询语言由 IBM 公司 1981 年推出,是用于存取数据以及查询、更 新和管理关系数据库系统的语言。 SQL 语言包含 4 个部分:  数据定义语言 (DDL) ,例如: CREATE 、 DROP 、 ALTER 等语句。  数据操作语言 (DML) ,例如: INSERT (插入)、 UPDATE (修改)、 DELETE (删除)语句。  数据查询语言 (DQL) ,例如: SELECT 语句。  数据控制语言 (DCL) ,例如: GRANT 、 REVOKE 、 COMMIT 、 ROLLBACK 等语句。 2015/7/14 PHP & Web2.0 | Page 3

数据库设计 数据库设计 (Database Design) 是指对于一个给定的应 用环境,构造最优的数据库模式,建立数据库及其应 用系统,使之能够有效地存储数据,满足各种用户的 应用需求(信息要求和处理要求)。  需求分析阶段:综合各个用户的应用需求  概念设计阶段:形成独立于机器特点,独立于各个 DBMS 产品的概念模式 (E-R 图 )  逻辑设计阶段:首先将 E-R 图转换成具体的数据库产品 支持的数据模型,如关系模型,形成数据库逻辑模式; 然后根据用户处理的要求、安全性的考虑,在基本表的 基础上再建立必要的视图 (View)  物理设计阶段:根据 DBMS 特点和处理的需要,进行物 理存储安排,建立索引 2015/7/14 PHP & Web2.0 | Page 4

数据库设计 - 需求分析 根据用户需求抽象出实体 (Entity) ,明确实体所具有的属性 (Attribute) ,理解各实体之间的联系 (Relationship) 。 了解输入输出需求以设计表结构、报表、查询和视图。 实例 - 简单网络书签系统:  需求:用户收藏不同的网址重新命名并加上标签形成自己的书签  实体:网址 (Url) 、用户 (User) 、书签 (Bookmark) 、标签 (Tag)  属性: Url: url_id 、 url 、 url_hash User: user_id 、 username 、 Bookmark: bm_id 、 bm_title 、 tags Tag: tag_id 、 tag_name  联系:上述实体两两之间都存在联系 2015/7/14 PHP & Web2.0 | Page 5

数据库设计 -E-R 图 E-R 图也称实体 - 联系图 (Entity Relationship Diagram) ,提供 了表示实体类型、属性和联系的方法,用来描述现实世界的概 念模型。 传统 E-R 图:矩形代表着实体性,椭圆代表着实体的属性,菱 形代表实体间的关系。下图为不包含 tag 实体的示例: 2015/7/14 PHP & Web2.0 | Page 6 User Url save user_id username url_id url url_hash own has Bookmark bm_idbm_titletags

数据库设计 - 表和字段的设计 标准化和规范化:数据的标准化有助于消除数据库中 的数据冗余。 第三范式 Third Normal Form ( 3NF ) 通常被认为在性能、扩展性和数据完整性方面达到了 最好平衡 第三范式 数据驱动:常用属性与非常用属性分离、读取数据与 查询数据分离 选择数字类型和文本类型尽量充足,也不要太大 便于查询的临时表与计数字段、自动计时字段等 2015/7/14 PHP & Web2.0 | Page 7

数据库设计 - 选择键和索引 键是唯一性的索引  为实体属性表建立自增长的主键  为关联字段创建外键 索引是从数据库中获取数据的最高效方式之一。 95% 的数据库性能问题都可以采用索引技术得到解决。  为组合查询建立多字段索引  不要索引 memo/note 字段,不要索引大型字段(有很多字 符),这样作会让索引占用太多的存储空间。  不要索引常用的小型表 2015/7/14 PHP & Web2.0 | Page 8

数据库设计 - 数据完整性设计 外键关联:  浅谈 MySQL 外键 浅谈 MySQL 外键  触发器关联  教你快速掌握 MySQL 数据库中触发器的应用 教你快速掌握 MySQL 数据库中触发器的应用 2015/7/14 PHP & Web2.0 | Page 9

数据库优化 数据库优化的目标是加快查询速度、避免磁盘 I/O 瓶 颈、减少 CPU 利用率和减少资源竞争。  MySQL 手册第七章(重点:优化数据库结构、优 化查询语句)  数据库优化设计方案 数据库优化设计方案 2015/7/14 PHP & Web2.0 | Page 10

大批量数据处理 插入大量数据前禁用索引 高效的 LOAD DATA INFILE 语句 需要复杂计算的数据交给高级语言或脚本来做 2015/7/14 PHP & Web2.0 | Page 11

非关系型数据库 NoSQL NoSQL 是非关系型数据存储的广义定义, NoSQL 数据 存储不需要固定的表结构,通常也不存在连接操作。 随着互联网 web2.0 网站的兴起,传统的关系数据库在 应付 web2.0 网站,特别是超大规模和高并发的 SNS 类 型的 web2.0 纯动态网站已经显得力不从心 :  High performance - 对数据库高并发读写的需求  Huge Storage - 对海量数据的高效率存储和访问的需求  High Scalability && High Availability- 对数据库的高可扩展性 和高可用性的需求 Google 的 BigTable 、 Amazon 的 Dynamo 、 Apache Cassandra (Facebook 开发, Twitter 、 Digg 使用 ) Cassandra 了解 NoSQL 的必读资料 了解 NoSQL 的必读资料 NoSQL 数据库笔谈 NoSQL 数据库笔谈 2015/7/14 PHP & Web2.0 | Page 12

2015/7/14 PHP & Web2.0 | Page 13

Thanks! zxzhang5 AT mail.ustc.edu.cn BBS id: howdy webclub ftp: ftp:// zxzhang5 AT mail.ustc.edu.cn 用户名、密码 : webclub