博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
高性能计算摘要
阅读量:7242 次
发布时间:2019-06-29

本文共 821 字,大约阅读时间需要 2 分钟。

插队<<< doubanclaim64ea944f8164f0e1

从计算任务的特质来看分为:

1、大计算量,小数据量

2、大数据量,计算相对简单

3、大数据量,大计算量

常见的工作负载有:

1、日志分析,PB级别

2、脱机分析,商业智能,重数据量,TB级别

3、调查式分析,重响应速度,100GB以下

4、金融计算,蒙特卡洛算法,大计算量

常见的分布式计算框架:

1、Hadoop,以分布式文件系统为核心的 Map reduce 框架,擅长超大数据量,高延迟,IO开销大

2、GridGain,以内存数据库为核心的分布式计算框架,擅长大计算量,低延迟,IO开销小

计算的结构有三种:

1、SMP

2、NUMA

3、分布式计算

延迟时间上升,换取计算总能力的上升。IO是主要制约因素。计算量问题首先是IO问题。

从解决问题尝试顺序来说有四层:

1、单线程

2、并行化

3、分布化

4、平台化

并行化的主要目的是突破单核的计算能力上限

分布化的主要目的是突破单机的计算能力上限

平台化的主要目的是突破单项目的能力上限

并行化的根本挑战:

1、任务的切分

2、任务的调度

重心在算法逻辑上

并行化的主要问题:

1、资源争抢

2、数据的隔离性

3、数据的可见性

4、饥饿,死锁,活锁

分布化的根本挑战:

1、计算节点之间的高延迟

2、分布化之后缺乏OS这样的管理者角色

在并行化解决了算法问题之后,分布化主要是为了克服物理限制

分布化的主要问题

1、更容易产生死锁和饥饿

2、拓扑管理

3、异构环境

4、容错机制

5、分布式负载均衡

6、存储能力共享

7、计算能力共享

8、代码的部署和准备

9、集群的监控和管理

平台化的根本挑战:业务问题,政治问题

平台化的主要问题:

1、统一的计算抽象

2、统一的数据抽象

3、异构数据的处理

4、业务优先级的保证

平台化的根本挑战

从实现层面看,有三层问题需要考虑:

1、计算流程

2、多机计算

3、单机计算

转载地址:http://hmybm.baihongyu.com/

你可能感兴趣的文章
讨论76 怎么查一下我机器的内存?AIX环境
查看>>
001设计模式 -- 策略模式
查看>>
Java中的基本数据类型
查看>>
wordpress 插件推荐
查看>>
对于[]()+!的研究
查看>>
jquery中对于为一组标签赋予点击事件
查看>>
文档模型(JSON)使用介绍
查看>>
实验2 柱状图生成
查看>>
利用GCTA工具计算复杂性状/特征(Complex Trait)的遗传相关性(genetic correlation)...
查看>>
Python递归报错:RuntimeError: maximum recursion depth exceeded in comparison
查看>>
[Codeforces178F2]Representative Sampling
查看>>
NPOI创建Word
查看>>
Entity Framework 使用注意:Where查询条件中用到的关联实体不需要Include
查看>>
mysql因为服务器异常关机倒是启动不了 找不到mysql.sock
查看>>
矩阵的坐标变换(转)
查看>>
清除浮动(带来的影响) clear与margin重叠
查看>>
C语言移位
查看>>
深度了解git工具
查看>>
Integer cache -127 - 128
查看>>
如何拷贝一个wchar_t类型的字符串
查看>>