Épp a napokban botlottam bele egy kódoptimalizációs problémába. SSE utasításokkal (ADDPS, CMPPS, PADDD) kívántak nagymennyiségű (több MiB) lebegőpontos számadat közt kiugró értékeket keresni. A ciklusmag 2 órajel alatt dolgozott fel 16 bájtot. Szerették volna 1 órajelre levinni. Ez a 2 órajeles ciklusmag 3GHz-es Core2 magon 22,35GiB/s-ra képes. Négy mag esetén 89,5GiB/s-ot jelent. Mennyi is az elméleti sávszélessége a DDR3-1600-nak? 12,5GiB/s? Dual channel? 25?
[ Szerkesztve ]