路漫漫其修远兮 路漫漫其修远兮
中英对照表 English 中文 cross production 叉积 determinantion 行列式 eigenvalue 特征值 Vector The introduction of numbers as coordinates is an act of violence.
AND on the flip side, it gives people a language to descrbie space and the manipulation of space using numbers that can be crunched and run through a computer. 暴论:线代让程序员可以操纵空间。
图论
动态规划
基础算法 排序 快速排序算法模板 —— 模板题 AcWing 785. 快速排序
Tim 发布于 2023-02-27 收录于 网络 背景:有一台服务器,仅能访问ssh服务端口,其余端口处于安全考虑均不可访问。如果想与服务器的其他端口通信,该怎么办?
利用ssh通道,即可任意通信,下面这张图很直观。 基本命令 基本命令如下:
1 ssh -L 本地端口X:主机C:主机C端口Z username@hostB 利用本机与hostB的SSH隧道,通过访问本机的X端口实现对主机C Z端口的访问。本质是B访问了C,再经由通道与本机连接。 技巧 其实也不用特别记忆这个命令,一般的ssh软件如xshell, tabby等都有对应的端口转发功能,可以在图形界面直接配置。
大纲 1.认识数据挖掘 1、数据挖掘的定义 2、有指导学习和无指导学习 3、数据挖掘的过程
2.基本数据挖掘技术 1、决策树概念和C 4.5算法的一般过程 2、决策树关键技术:最大增益率 3、决策树规则:决策树,产生式规则,正确率和覆盖率 4、Apriori算法的基本思想 5、关联规则及其置信度和支持度 6、K-means算法的基本思想 7、K-means聚类分析实例
第一章 产生背景 横向拓展,水平拓展;用更多的节点支持更大量的请求。
纵向拓展,垂直拓展;扩展一个节点的能力支撑更大量的请求。
大数据的特点:volume,velocity,variety,value
考试题型 论述题(30分) -论述自己对概念的理解 分布式数据库设计及查询优化(20) -分布式数据库的设计,分片的设计、定义、对应的查询优化 分布式存取优化(30) -物理上的特征指标、传输代价的计算 存储结构设计 (10) -HBase设计、布隆过滤器设计(PPT) 分布式事务 (10) -一致性、并发控制 三次作业分别对应了2、3、4项 章节回顾 第一章 大数据的由来(为什么会产生大数据存储系统?横向拓展需求、系统可靠可用、一致性需求在传统的关系模型下无法有效解决) 大数据的特点 大数据需要怎样的存储系统 第二章 客户/服务器的体系结构(不同体系结构中AP功能的变化) share nothing 架构、分库分表架构、存算分离架构与客户/服务器架构之间的关系(开放性问题,结合PPT与自己的理解)参考文章 关系型分布式数据库系统的模式结构 分布式数据库系统的数据透明性(三种、定义,举例;给操作语句判定是那种透明性) 多数据库系统和分布式数据库系统的区别与联系 第三章 分布式数据库设计的分片原则、定义(运算)、表示方法 分布式数据库的查询优化策略及片段查询优化方法 分布式查询的存取优化方法、特征参数的计算(选择运算、投影运算、自然连接运算、半连接运算) 第四章 HBase解决了HDFS的哪些问题?具有哪些特点? HBase数据库中region的含义及其特性。同一个表不同行的数据可以存放在不同的服务器,同一个表相同行的数据也可以存放在不同的服务器。这句话如何理解? 一个服务器是Region的存储机构,但存储一个Region不代表存储一个表;每个Region都包含若干个Store,一个Store就是一个列族,是把列族作为对象存储的,不一定是一个表的,可能是不同表的分片。