快捷索引


会员福利

资源无源时,可利用百度网盘 & 迅雷云盘取回

此内容仅供注册用户。请 %登录%.

[计算机系统结构量化研究方法(第5版)].Computer.Architecture.A.Quantitative.Approach.5th.pdf
8.05MB

中文名: 计算机系统结构:量化研究方法(第5版)

原名: Computer Architecture: A Quantitative Approach

作者: John L.Hennessy 斯坦福大学校长

IEEE和ACM会士

美国国家工程研究院院士及美国科学艺术研究院院士。Hennessy教授因为在RISC技术方面做出了突出贡献而荣获2001年的Eckert-Mauchly奖章

他也是2001年Seymour Cray计算机工程奖得主

并且和本书另外一位作者David A.Patterson分享了2000年John von Neumann奖。

图书分类: 硬件

资源格式: PDF

版本: 文字版 第5版

出版社: Elsevier, Inc

书号: 9780123838728

发行时间: 2012年

地区: 美国

语言: 英文

简介:

Table of Contents

=================

1 章节变化

1.1 强调了功耗

1.2 更加强调存储体系结构

1.3 合并了ILP(Instruction-Level Parallelism)章节

1.4 增加了对向量、SIMD和GPU等强大数据流并行支持一章

1.5 对称多处理器和多线程并行章节变化不大

1.6 增加了Warehouse-Scale一章介绍面向请求和数据的并行

1.7 弱化外部存储章节

2 《编译点滴》评论

3 其他变化

4 相关资源

1 章节变化

~~~~~~~~~~~

1.1 强调了功耗

===============

第一章在Put it all together中,侧重了对功耗的考察。

1.2 更加强调存储体系结构

=========================

在第4版中,存储体系结构虽然也是很重要的一章,但被放置在第5章。而第5版中,直接将其放置在了第2章。

本章中除了讨论Cache、SRAM和DRAM,还增加了对Flash的讨论。

Put it all together中所举的例子,也从AMD Opteron,改成了ARM Cortex-A8和Core I7。

1.3 合并了ILP(Instruction-Level Parallelism)章节

===================================================

ILP一章主要介绍了指令级并行的相关概念,在第4版中分为两个章节分别在第2和第3章中论述。第5版中,将两个章节做了合并,在第3章中介绍。

这一章中的Put It All Together也主要讨论ARM Cortex A8和Core I7.

《量化》第3版曾使用大量的篇幅介绍安腾和VLIW中的指令级并行,第4版虽然增加了对Power处理器和X86处理器的介绍,但安腾的VLIW也被一并介绍。

第5版则干脆直接ARM和Core。关于安腾和VLIW的介绍,放到了附录里。作者给出的理由是“This architecture did not live up to the earlier claims”.

即作者觉得这种体系结构实际效果并没有开始时声称的那么好.

1.4 增加了对向量、SIMD和GPU等强大数据流并行支持一章

====================================================

不管是高性能计算领域,还是嵌入式手机上,现在貌似不用上GPU就不够时尚。

《量化》在第4版只在附录中介绍了一下向量机,在第5版中则在正文中第4章完整的介绍该体系结构。

而且作者用了“contain the most detailed and clearset explanation of GPU yet”来形容这一章的内容,而且用了”particularly proud about“形容自己对这一章的态度。

可见,这一章将是本书让作者最为骄傲的亮点之一(之二是第6章对Google Warehouse-scale计算机的论述,没有之三)。

这一章主要介绍了GPU的体系结构,并选择Core I7、Nvidia GTX系列GPU和 Tegra 2 GPU进行比较。

1.5 对称多处理器和多线程并行章节变化不大

=========================================

这一章主要介绍线程级并行,但标题从第四版的”Multiprocessors and Thread-Level Application”,缩减成了“Thread-Level Application”,作者并没有提为什么少了一个词。

Put It All Together 部分的介绍也从Sun T1变成了 Core I7.

1.6 增加了Warehouse-Scale一章介绍面向请求和数据的并行

======================================================

warehouse规模计算机(Warehouse-Scale Computer, WSC),即将整个数据中心看作一台计算机。这种规模的计算机面向的主要是互联网服务。

作者在撰写这一章时,得到了许多Amazon和Google一线工程师的协作,论述WSC计算机的设计、成本和性能。

本章从MapReduce的编程模型谈起,接着描述WSC计算机的物理实现,以及能耗、成本、性能的情况。

Put It All Together部分详细介绍了Google WSC的情况,许多内容都是在本书中首次公开。

(《编译点滴》也将持续跟进这部分内容,敬请关注。)

1.7 弱化外部存储章节

=====================

“Storag System”一章,是《量化》第4版本正文中的一章,在第5版中,被放入了附录里。

2 《编译点滴》评论

~~~~~~~~~~~~~~~~~~~

从第4版到第5版,书中的亮点“Put It All Together”部分,从介绍Intel Pentium 4, Sun T1,AMD Opteron等好几款CPU的结构,缩减为介绍ARM Cortex 和Core I7。

看来作者也看好Intel和ARM的未来发展。

第5版的《量化》更加关注个人移动设备上的体系结构发展,以及数据中心端的体系结构发展,所以选择了面向个人设备的ARM Cortex系列CPU和面向数据中心的Intel Core I7 CPU。

除了第一章基础介绍和第二章存储结构外,第3-6章每一章的标题中都有“Parallelism”。总共涉及了如下几个方面:

– 指令级并行(ILP)

– 数据级并行(DLP)

– 线程级并行(TLP)

– 请求级并行(RLP)

其中数据级并行占用的章节最多,而且都是第5版《量化》中新增加的章节–第4章GPU和第6章数据中心。数据正变得越来越重要。

`

3 其他变化

~~~~~~~~~~~

– 定价贵了,原价从第4版的78元,涨到了138元。

– 变厚了一点,正文部分从423页增加到了493页。

– 纸质和印刷质量都下降了很多。钢笔没有办法在书纸上书写,渗墨很严重。而且印刷质量也不好,油墨的味道很大。

4 相关资源

~~~~~~~~~~~

http://www.amazon.com/Computer-Architectur…2383872X

http://booksite.mkp.com/9780123838728/ (附录章节、课后习题答案下载)

目录:

Foreword

Preface

Acknowledgments

Chapter 1 Fundamentals of Quantitative Design and Analysis

1.1 Introduction

1.2 Classes of Computers

1.3 Defining Computer Architecture

1.4 Trends in Technology

1.5 Trends in Power and Energy in Integrated Circuits

1.6 Trends in Cost

1.7 Dependability

1.8 Measuring, Reporting, and Summarizing Performance

1.9 Quantitative Principles of Computer Design

1.10 Putting It All Together: Performance, Price, and Power

1.11 Fallacies and Pitfalls

1.12 Concluding Remarks

1.13 Historical Perspectives and References Case Studies and Exercises by Diana Franklin

Chapter 2 Memory Hierarchy Design

2.1 Introduction

2.2 Ten Advanced Optimizations of Cache Performance

2.3 Memory Technology and Optimizations

2.4 Protection: Virtual Memory and Virtual Machines

2.5 Crosscutting Issues: The Design of Memory Hierarchies

2.6 Putting It All Together: Memory Hierachies in the ARM Cortex-AS and Intel Core i7

2.7 Fallacies and Pitfalls

2.8 Concluding Remarks: Looking Ahead

2.9 Historical Perspective and References Case Studies and Exercises by Norman P. Jouppi, Naveen Muralimanohar, and Sheng Li

Chapter 3 nstruction-Level Parallelism and Its Exploitation

3.1 Instruction-Level Parallelism: Concepts and Challenges

3.2 Basic Compiler Techniques for Exposing ILP

3.3 Reducing Branch Costs with Advanced Branch Prediction

3.4 Overcoming Data Hazards with Dynamic Scheduling

3.5 Dynamic Scheduling: Examples and the Algorithm

3.6 Hardware-Based Speculation

3.7 Exploiting ILP Using Multiple Issue and Static Scheduling

3.8 Exploiting ILP Using Dynamic Scheduling, Multiple Issue, and Speculation

3.9 Advanced Techniques for Instruction Delivery and Speculation

3.10 Studies of the Limitations oflLP

3.11 Cross-Cutting Issues: ILP Approaches and the Memory System

3.12 Multithreading: Exploiting Thread-Level Parallelism to Improve Uniprocessor Throughput

3.13 Putting It All Together: The Intel Core i7 and ARM Cortex-AS

3.14 Fallacies and Pitfalls

3.15 Concluding Remarks: What’s Ahead?

3.16 Historical Perspective and References Case Studies and Exercises by Jason D. Bakos and Robert R Colwell

Chapter4 Data-Level Parallelism in Vector, SIMD, and GPU Architectures

4.1 Introduction

4.2 Vector Architecture

4.3 SIMD Instruction Set Extensions for Multimedia

4.4 Graphics Processing Units

4.5 Detecting and Enhancing Loop-Level Parallelism

4.6 Crosscutting Issues

4.7 Putting It All Together: Mobile versus Server GPUS and Tesla versus Core i7

4.8 Fallacies and Pitfalls

4.9 Concluding Remarks

4.10 Historical Perspective and References Case Study and Exercises by Jason D. Bakos

Chapter 5 Thread-Level Parallelism

5.1 Introduction

5.2 Centralized Shared-Memory Architectures

5.3 Performance of Symmetric Shared-Memory Multiprocessors

……

Chapter6 Warehouse-Scale Computers to Exploit Request-Level and Data-Level Parallelism

Appendix A Instruction Set Principles

Appendix B Review of Memory Hierarchy

Appendix C Pipelining: Basic and Intermediate Concepts
《计算机体系结构-量化研究方法》是计算机体系结构领域,最经典也是最前沿的教材。

经典,是因为没有其他的书能超越此书在体系结构领域的地位。前沿,是因为这本书基本是每5年左右再版一次。紧紧围绕最新的体系结构方向的变化。

所以这篇文章,虽然是在对比《量化》第4版和第5版的区别,却胆敢标题里加上“体系结构这五年”的原因。

《量化》第5版是前天在国内市场正式上市的,《编译点滴》在第一时间拨出巨款购入此书。

就是希望能为各位朋友送上更有价值的博文。


书我要,下载先! http://www.books51.com/ 祝您开卷有益!


标签: ,


文章类别:

本文链接: https://www.books51.com/292908.html

【点击下方链接,复制 & 分享文章网址】

计算机系统结构:量化研究方法 文字版 第5版 → https://www.books51.com/292908.html

上一篇:

下一篇:

0 ratings, 0 votes0 ratings, 0 votes (0 次顶, 0已投票)
你必须注册后才能投票!
Loading...

添加新评论