32bit:普通的X86架构(i386,i586,i686)
64bit:仅指X86_64架构(AMD64,EM64T)

关于X86_64架构(因为EM64T几乎都是模仿AMD64的,所以我觉得这里以AMD64为准):
摘自 《AMD64 Architecture Programmer’s Manual Volume 1: Application Programming》

QUOTE:
The AMD64 architecture introduces these new features:

Register Extensions (see Figure 1-1 on page 2):
- 8 new general-purpose registers (GPRs).
- All 16 GPRs are 64 bits wide.
- 8 new 128-bit XMM registers.
- Uniform byte-register addressing for all GPRs.
- A new instruction prefix (REX) accesses the extended registers.
Long Mode (see Table 1-1 on page 3):
- Up to 64 bits of virtual address.
- 64-bit instruction pointer (RIP).
- New instruction-pointer-relative data-addressing mode.
- Flat address space.

网上比较直白的描述:

AMD64

QUOTE:
AMD64的位技术是在原始32位X86指令集的基础上加入了X86-64扩展64位X86指令集,使这款芯片在硬件上兼容原来的32位X86软件,并同时支持X86-64的扩展64位计算,使得这款芯片成为真正的64位X86芯片。这是一个真正的64位的标准,X86-64具有64位的寻址能力。
X86-64新增的几组CPU寄存器将提供更快的执行效率。寄存器是CPU内部用来创建和储存CPU运算结果和其它运算结果的地方。标准的32-bit x86架构包括8个通用寄存器(GPR),AMD在X86-64中又增加了8组(R8-R9),将寄存器的数目提高到了16组。X86-64寄存器默认位 64-bit。还增加了8组128-bit XMM寄存器(也叫SSE寄存器,XMM8-XMM15),将能给单指令多数据流技术(SIMD)运算提供更多的空间,这些128位的寄存器将提供在矢量和标量计算模式下进行128位双精度处理,为3D建模、矢量分析和虚拟现实的实现提供了硬件基础。通过提供了更多的寄存器,按照X86-64标准生产的 CPU可以更有效的处理数据,可以在一个时钟周期中传输更多的信息。

EM64T

QUOTE:
Intel官方是给EM64T这样定义的:EM64T全称Extended Memory 64 Technology,即扩展64bit内存技术。EM64T是Intel IA-32架构的扩展,即IA-32e(Intel Architectur-32 extension)。IA-32处理器通过附加EM64T技术,便可在兼容IA-32软件的情况下,允许软件利用更多的内存地址空间,并且允许软件进行32 bit线性地址写入。EM64T特别强调的是对32 bit和64 bit的兼容性。Intel为新核心增加了8个64 bit GPRs(R8-R15),并且把原有GRPs全部扩展为64 bit,如前文所述这样可以提高整数运算能力。增加8个128bit SSE寄存器(XMM8-XMM15),是为了增强多媒体性能,包括对SSE、SSE2和SSE3的支持。
Intel为支持EM64T技术的处理器设计了两大模式:传统IA-32模式(legacy IA-32 mode)和IA-32e扩展模式(IA-32e mode)。在支持EM64T技术的处理器内有一个称之为扩展功能激活寄存器(extended feature enable register,IA32_EFER)的部件,其中的Bit10控制着EM64T是否激活。Bit10被称作IA-32e模式有效(IA-32e mode active)或长模式有效(long mode active,LMA)。当LMA=0时,处理器便作为一颗标准的32 bit(IA32)处理器运行在传统IA-32模式;当LMA=1时,EM64T便被激活,处理器会运行在IA-32e扩展模式下。

注意:在早期的EM64T的intel CPU中,似乎并没有增加寄存器,只是增加了寻址范围到48bit。所以不是真正意义上的64bit CPU。第一个完完全全做的和AMD64一样的是Intel Celeron D 352。在概念上,Intel的CPU似乎只是向上扩展让32bit来兼容64bit,AMD则是让64bit来兼容32bit,实际上,个人觉得到目前为止,这两个已经完全一样了。都可以称之为64bit CPU,不过他们还是不能和Itanium这种相提并论,实际上64bit CPU还没有被定义。

关于使用64bit系统的一点体会:
使用的系统 CentOS 4.4 32bit 64ibt/Debian Etch 64bit
CPU:分64bit和32bit的,对应相对的操作系统

QUOTE:
processor : 0
vendor_id : GenuineIntel
cpu family : 6
model : 15
model name : Intel(R) Xeon(R) CPU 5110 @ 1.60GHz
stepping : 6
cpu MHz : 1596.480
cache size : 4096 KB
physical id : 0
siblings : 2
core id : 0
cpu cores : 2
fpu : yes
fpu_exception : yes
cpuid level : 10
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm syscall nx lm pni monitor ds_cpl tm2 cx16 xtpr
bogomips : 3195.50
clflush size : 64
cache_alignment : 64
address sizes : 36 bits physical, 48 bits virtual
power management:

QUOTE:
processor : 0
vendor_id : GenuineIntel
cpu family : 15
model : 2
model name : Intel(R) Xeon(TM) CPU 2.40GHz
stepping : 9
cpu MHz : 2401.234
cache size : 512 KB
physical id : 0
siblings : 2
core id : 0
cpu cores : 1
fdiv_bug : no
hlt_bug : no
f00f_bug : no
coma_bug : no
fpu : yes
fpu_exception : yes
cpuid level : 2
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe cid xtpr
bogomips : 4803.68

内存:32bit 2G/64bit 4G

个人觉得在64bit系统中,大部分64bit程序速度的确快于32bit的系统,最大大概能快50%左右。但是相对的,耗用内存也明显大于32bit,最大大概能多占36%左右的内存。
你完全可以理解成用内存来换性能。而且这个性能更体现在大规模运算中,比如编码视频文件。在LAMP服务中,性能大概只能提升20%左右。
另外64bit现在还不是很普及,至少没有32bit普及,在linux下对于某些闭源的软件,很难找到它所对应的64bit版本。还有就是一些奇奇怪怪的问题,比如拿32bit系统中的cacti来统计64bit系统中的网卡,你会发现数据经常被溢出而导致统计不正常,解决方法是用64bit来统计,好在cacti官方支持64bit的模板。如果官方比较古老不支持呢?那就比较麻烦了吧。。。

其实也没什么好总结的。用32bit还是用64bit就看个人喜好了。