月度归档：2010年05月

归途

发表评论

在一个地方久了，也就习惯了，当你要回家的时候，你就会想，何处是家？

半年的时间，在人的整个生命中来说，也就是那么一瞬的事情。在这个短暂的时间里，我都不敢去回忆太多，因为这样会让一个人变得矫情。曾经我也是一个很多愁善感的人，由一些事情，一些人，让我长大了，变得内心更加强大起来。

不是我对这里没有感情，也不是我没有留恋，而是在另一头不太遥远的地方，有我的家人，也有我的朋友，更重要的是有我的她。

朋友啊，人这一辈子，来来去去，新朋友，老朋友，离开前认识的朋友，一节课的朋友，太多太多的相聚和别离。说：天下没有不散的宴席，又说：离别是为了下次的相聚。

所以，就只轻轻道一声：朋友，珍重，有缘定会再见。

有关用户体验

2条回复

好久没有发自己的日志了，今天突然想写点东西。事由刚才大宝让我给他用QQ邮箱发东西，然后就产生了一下这篇谈疼文，搞不好还会被认为是枪手文。

从 QQ邮箱的用户体验说起：

我平时没怎么用过QQ邮箱，感觉是一个很鸡肋的功能，特别是里面还经常有各种广告，那拦截效率就不说了。不知道是我自己关了提醒，还是本来就没有，每次收到同学的贺卡或者祝福邮件，也不会提示。囧。

然后刚才就用一下吧，点击了QQ上面那个邮箱的标志，竟然还让我输用户名和密码登陆，就不能智能点直接打开？

好，那我就关了再点一次，又是一样的效果。直到第三次才不知道怎么弄好了，就算是他的BUG吧。进去之后，我点击发信，然后开始在收件人框里面输入大宝的备注名称，因为不知道QQ号和原名，显示结果似乎不能匹配……然后我只好到联系人里面找，然后发现里面的好友分组还是几年前的，囧……

然后向大宝询问，说是要同步好友，就想，在这个天天嚷着要云计算的日子里，竟然还要手动同步联系人……

终于，我把QQ邮箱关了，舒了口气…… 回想着很方便的gmail，哎……

QQ邮箱真的是没法比啊……

Gmail，可以关键字搜索，联系人匹配做得多好，全选邮件两页之后，就会问你是不是需要整个收件箱全选，还有很多快捷的按钮，比如标记已读啊，用一个邮箱收很多邮箱的邮件，等等…… 再写就真以为我是google的托了……

从学计算机的角度来讲，一个软件的用户体验真的是很重要，这也是为什么苹果的东西那么多贵，但是还是会有很多人用吧，虽然国内还没有普及起来。很多时候，并不是每个人都是计算机专业人员，也不是都很熟悉计算机的操作，这个时候，就是看谁的东西最好用，最方便，才能赢得最多的用户了。

写完了再看看，有点猫扑的风格，也有点谈疼，就当无聊吧，刚吃了饭，闲得没事。

继续搞毕设吧……

CUDA学习笔记（四）——CUDA性能

发表评论

四、CUDA性能

CUDA中的block被划分成一个个的warp，在GeForce8800GTX上，一个warp有32个线程。若不够32个线程，则padding相应数目的线程。Warp中的线程ID是连续且递增的。对于二维组织的线程来说，先把threadIdx.y为0的线程按照threadIdx.x从小到大排，然后把threadIdx.y为1的线程按照threadIdx.x从小到大的顺序排列成warp。对于三维组织的线程来说，先排列 threadIdx.z为0的二维线程，再排列threadIdx.z为1的二维线程，以此类推。

任何时刻，硬件都只能一次选择执行一个warp。

下面2个图是执行元素总和的操作，不同的算法实现，其效率不同。第二种方法使得线程没有分支。

继续阅读 →

CUDA学习笔记（三）——CUDA内存

发表评论

三、CUDA内存

2009-10-29

内存类型

CGMA: Compute to Global Memory Access ratio

继续阅读 →

CUDA学习笔记（二）——CUDA线程模型

发表评论

一个grid中的所有线程执行相同的内核函数，通过坐标进行区分。这些线程有两级的坐标，blockId和threadId，由CUDA runtime system指定。grimDim.x标识block在x维度上的数目，gridDim.y标识block在y维度上的数目。例如,

继续阅读 →

CUDA学习笔记（一）——CUDA编程模型

发表评论

转自新浪博客： http://blog.sina.com.cn/s/blog_48b9e1f90100fm56.html

一、CUDA 编程模型

2009-10-21

CUDA的代码分成两部分，一部分在host(CPU)上运行，是普通的C代码；另一部分在device(GPU)上运行，是并行代码，称为kernel，由nvcc进行编译。

Kernel产生的所有线程成为Grid。在并行部分结束后，程序回到串行部分即到host上运行。

在CUDA中，host和device有不同的内存空间。所以在device上执行kernel时，程序员需要把host memory上的数据传送到分配的device memory上。在device执行完以后，需要把结果从device传送回host，并释放device memory。CUDA runtime system提供了API给程序员做这些事情。

继续阅读 →

19th meeting

发表评论

这次开会主要是演示了一下evaluation的东西，了解到需要进行一些更科学的评测。

比如mu取不同值，sigma趋向于零的时候，也就是说，当所有的任务需要时间都相似的时候，动静态调度的对比。

另外取不同的MU值，SIGMA不同的时候，当irregular，大小变化的时候，加速比的变化。

这几天做完了，基本上就是这样了。

论文正在进行中。中英文并行，需要把自己做的东西写明白一点。

还有两个星期，事情还是挺多的，完成论文的同时，处理好回去前的一些事情。

另外搞一搞GPU，写一个概述出来。交待好需要做的任务~

OVER~ 加油！

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

大顾在学习

路漫漫其修远兮

月度归档：2010年05月

归途

有关用户体验

CUDA学习笔记（四）——CUDA性能

CUDA学习笔记（三）——CUDA内存

CUDA学习笔记（二）——CUDA线程模型

CUDA学习笔记（一）——CUDA编程模型

19th meeting