data structure

data structure sample code written in different programming languages.

概念

数据

描述客观事物的符号，是能被计算机识别并输入给计算机处理的符号集合。
1. 可以输入到计算机中
2. 能被计算机程序处理
数据元素

是组成数据的、有一定意义的基本单位，在计算机中通常作为整体处理，也称为“记录”。
数据项

一个数据元素可以由若干个数据项组成，数据项是数据不可分割的最小单位。

注：“数据项”是数据的最小单位，但“数据元素”才是数据结构中建立数据模型的基础
数据对象

性质相同的数据元素的集合，是数据的子集。

注：“性质相同”指数据元素具有相同数量和类型的数据项
数据结构

相互之间存在一种或多种特定关系的数据元素的集合。

逻辑结构

逻辑结构指数据对象中数据元素之间的相互关系。逻辑结构是针对具体问题的，是为了解决某个问题，在对问题理解的基础上，选择一个合适的数据结构表示数据元素之间的逻辑关系。

逻辑结构分为：

集合结构

集合结构中的数据元素除了同属于一个集合外，它们之间没有其他关系。各个数据元素是“平等”的，它们的共同属性是“同属于一个集合”。
线性结构

线性结构中的数据元素之间是“一对一”的关系。
树形结构

树形结构中的数据元素之间存在一种“一对多”的层次关系。
图形结构

图形结构的数据元素是“多对多”的关系。

物理结构

物理结构也叫做“存储结构”，是指数据的逻辑结构在计算机中的存储形式。数据是数据元素的集合，那么根据物理结构的定义，实际上就是如何把数据元素存储到计算机的存储器中。物理结构是面向计算机的，其基本的目标就是将数据及其逻辑关系存储到计算机的内存中。

数据元素的存储结构形式有两种：

顺序存储结构

把数据元素存放在地址连续的存储单元里，其数据间的逻辑关系和物理关系是一致的。
链式存储结构

把数据元素存放在任意的存储单元里，这组存储单元可以是连续的，也可以是不连续的。数据元素的存储关系并不能反映其逻辑关系，因此需要用一个指针存放数据元素的地址，这样通过地址就可以找到相关联数据元素的位置。

抽象数据类型（Abstract Data Type，ADT）

ADT是指一个数学模型及定义在该模型上的一组操作。抽象数据类型的定义仅取决于它的一组逻辑特性，而与其在计算机内部如何表示和实现无关。

ADT 
    抽象数据类型名
Data
    数据元素之间逻辑关系的定义
Operation
    操作1
        初始条件
        操作结果描述
    操作2
        ......
    操作n
        ......
endADT

算法

算法是解决特定问题求解步骤的描述，在计算机中表现为指令的有限序列，并且每条指令表示一个或多个操作。

算法具有五个基本特性：

输入

算法具有零个或多个输入。
输出

算法至少有一个或多个输出。
有穷性

算法在执行有限的步骤之后，自动结束而不会出现无限循环，并且每一个步骤在可接受的时间内完成。
确定性

算法的每一步骤都具有确定的含义，不会出现二义性。算法在一定条件下，只有一条执行路径，相同的输入只能有唯一的输出结果。算法的每个步骤被精确定义而无歧义。
可行性

算法的每一步都必须是可行的，也就是说，每一步都能够通过执行有限次数完成。可行性意味着算法可以转换为程序上机运行，并得到正确的结果。

算法设计的要求：

正确性

算法的正确性是指算法至少应该具有输入、输出和加工处理无歧义性、能正确反映问题的需求、能够得到问题的正确答案。
可读性

算法设计的另一目的是为了便于阅读、理解和交流。
健壮性

当输入数据不合法时，算法也能做出相关处理，而不是产生异常或莫名其妙的结果。
时间效率高和存储量低

时间效率指的是算法的执行时间，对于同一个问题，如果有多个算法能够解决，执行时间短的算法效率高，执行时间长的效率低。存储量需求指的是算法在执行过程中需要的最大存储空间，主要指算法程序运行时所占用的内存或外部硬盘存储空间。设计算法应该尽量满足时间效率高和存储量低的需求。

算法的时间复杂度（Big O）

在进行算法分析时，语句总的执行次数 T(n) 是关于问题规模n的函数，进而分析 T(n) 随n的变化情况并确定 T(n) 的数量级。算法的时间复杂度，也就是算法的时间量度，记作： T(n)=O(f(n)) 。它表示随问题规模n的增大，算法执行时间的增长率和 f(n) 的增长率相同，称作算法的渐近时间复杂度，简称为时间复杂度。其中 f(n) 是问题规模n的某个函数。

推导大O阶的方法：

用常数1取代运行时间中的所有加法常数
在修改后的运行次数函数中，只保留最高阶项
如果最高阶项存在且不是1，则去除与这个项相乘的常数

大O阶：

常数阶 O(1)

与问题的大小无关（n的多少），执行时间恒定的算法，我们称之为具有 O(1) 的时间复杂度，又叫常数阶。

线性阶 O(n)

for (int i = 0; i < n; i++)
{
    /* 时间复杂度为O(1)的程序步骤序列 */
}

线性阶包含循环。

对数阶 O(logn)

int count = 1;
while (count < n)
{
    count = count * 2;
    /* 时间复杂度为O(1)的程序步骤序列 */
}

对数阶首先有循环条件，其次计数值以2的倍数变化。

平方阶 O(n^2^)

int i, j;
for (i = 0; i < n; i++)
{
    for (j = 0; j < n; j++)
    {
        /* 时间复杂度为O(1)的程序步骤序列 */
    }
}

平方阶包含双重循环。

n(logn)阶
立方阶 O(n^3^)

常用的时间复杂度所耗费的时间从小到大排列：

O(1) < O(logn) < O(n) < o(n^2^) < O(n^3^) < O(2^n^) < O(n!) < O(n^n^)

注：从 O(n^3^) 起，过大的n都会使结果变得不现实，所以一般不讨论。

对算法的分析，一种方法是计算所有情况的平均值，这种时间复杂度的计算方法称为平均时间复杂度。另一种方法是计算最坏情况下的时间复杂度，这种方法称为最坏时间复杂度。一般在没有特殊说明的情况下，都是指最坏时间复杂度。

线性表（List）

零个或多个数据元素的有限序列。

ADT 线性表(List)
Data
    线性表的数据对象集合为{a1, a2, ......, an}，每个元素的类型均为DataType。
    其中，除第一个元素a1外，每一个元素有且只有一个直接前驱元素，
    除了最后一个元素an外，每一个元素有且只有一个直接后继元素。
    数据元素之间的关系是一对一的关系。
Operation
    InitList(*L):          初始化操作，建立一个空的线性表L。
    ListEmpty(L):          若线性表为空，返回true，否则返回false。
    ClearList(*L):         将线性表清空。
    GetElem(L, i, *e):     将线性表L中的第i个位置元素值返回给e。
    LocateElem(L, e):      在线性表L中查找与给定值e相等的元素，
                           如果查找成功，返回该元素在表中序号表示成功；

线性表的两种物理结构：

顺序存储结构

对每个线性表位置的存入或者取出数据，对于计算机来说都是相等的时间，也就是一个常数，存取时间性能为 O(1) 。具有这一特点的存储结构称为随机存取结构。

插入或删除数据时，时间复杂度都是 O(n) 。

一般用一维数组来实现顺序存储结构。
- 优点：
  1. 无须为表示表中元素之间的逻辑关系二增加额外的存储空间
  2. 可以快速地存取表中任一位置的元素
- 缺点：
  1. 插入和删除操作需要移动大量元素
  2. 当线性表长度变化较大时，难以确定存储空间的容量
  3. 造成存储空间的碎片
链式存储结构

数据元素除存储其本身的信息之外，还需存储一个指示其直接后继的信息。

把存储数据元素信息的域称为数据域，把存储直接后继位置的域称为指针域。指针域中存储的信息称做指针或链。这两部分信息组成数据元素的存储映像，称为结点（Node）。

链表中第一个结点的存储位置叫做头指针，最后一个结点指针为“空”（通常用NULL或“^”符号表示）。

为了更加方便地对链表进行操作，会在单链表的第一个结点前附设一个结点，称为头结点。头结点的数据域可以不存储任何信息，也可以存储如线性表的长度等附加信息。头结点的指针域存储指向第一个结点的地址。

链表获取某一数据元素的时间复杂度是 O(n) 。

链表的插入和删除操作都分为两部分：遍历查找第i个节点，时间复杂度 O(n) ；插入和删除节点，时间复杂度 O(1) ，所以整体时间复杂度 O(n)。

wangcl / datastructure Goto Github PK

datastructure's Introduction

data structure

概念

逻辑结构

物理结构

抽象数据类型（Abstract Data Type，ADT）

算法

算法的时间复杂度（Big O）

线性表（List）

datastructure's People

Contributors

Watchers

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent