个人不专业,随便说说。
我的理解是“大量的轻量级运算”适合在GPU上做,因为GPU本身就是走众核路线,但每个核心的结构都比较精简。像一些高端卡可以有上千甚至数千个运算单元,并且支持大量数据的并行运算。比如“挖矿”或者Poem@home或者用字典法破解密码之类,其原理就是用大量的数据去套用同一个数学公式,运算过程本身并不复杂,只是数据量非常大(比如,每组数据处理起来并不复杂,但有十亿组数据需要处理)。这时候GPU的众核优势就能体现出来:多个ALU同时运算。
与之相对的,在CPU上更适合算“少量复杂运算”。