Sun решил сделать шаг в правильном направлении. Я имею ввиду его новую архитектуру MAJC (Microprocessor Architecture for Java Computing). Новая она конечно только для Sun'a, на самом деле - это реализация на одном кристалле нескольких процессоров. Sun подает это как переход от instruction-level параллелизма к thread-level. Собственно - к MPP, от которой помнится ушли когда решили что ее слишком сложно программировать. Они и сейчас об этом помнят - судя по фразе "Chip multiprocessing is only useful if every processor has something to do," Литературно на русском это можно сказать так: "Область эффективного использования таких чипов весьма ограничена".
Каждый чип в MAJC содержит N процессоров, каждый процессор - 4 устройства исполнения (VLIW архитектура). Поскольку позволить себе роскошь держать память для каждого процессора прямо на чипе нельзя, в каждом процессоре сделали 100 регистров (и инструкции для загрузки сразу блока регистров), чтобы уменьшить частоту обращения к внешней памяти. Интересно, что все регистры могут быть как floating, так и integer. Впрочем, пока нет нормальной документации, это все не до конца ясно. Есть лишь краткое описание.