来自 编程 2019-11-15 01:49 的文章
当前位置: 网上澳门金莎娱乐 > 编程 > 正文

基于C语言char与unsigned char的区别介绍

用过C/C++的人都知道有个union,特别好用,似乎char数组到short,int,float等的转换无所不能,也确实是能,并且用起来十分方便。
那C#为什么没有这个关键字呢?怎么实现这个功能?其实C#只是没有了这个关键字,但是功能是能实现的,而且也是非常方便,并且是安全的。
网上有人用StructLayout特性来实现union,也确实是实现了一些功能。
比如:
网上澳门金莎娱乐,C/C++:
    union {
        unsigned char ch
        short ;
        int i;
    };
C#:
    [StructLayout(LayoutKind.Explicit)]
    public struct Class1
    {
        [FieldOffset(0)]
        public byte b;

在C中,默认的基础数据类型均为signed,现在我们以char为例,说明(signed) char与unsigned char之间的区别。

        [FieldOffset(0)]
        public short s;

首先在内存中,char与unsigned char没有什么不同,都是一个字节,唯一的区别是,char的最高位为符号位,因此char能表示-127~127,unsigned char没有符号位,因此能表示0~255,这个好理解,8个bit,最多256种情况,因此无论如何都能表示256个数字。

        [FieldOffset(0)]
        public int i;
    }
就可以实现。
但是我要是写个:
    union {
        unsigned char ch[4];
        int i;
        float f;
    } temp;
硬是用C#没有模拟出来,估计我还没有找着合适的方法。因为我写
    [StructLayout(LayoutKind.Explicit)]
    public struct Class1
    {
        [FieldOffset(0)]
        public byte[4] b;

在实际使用过程种有什么区别呢?主要是符号位,但是在普通的赋值,读写文件和网络字节流都没什么区别,反正就是一个字节,不管最高位是什么,最终的读取结果都一样,只是你怎么理解最高位而已,在屏幕上面的显示可能不一样。

        [FieldOffset(0)]
        public short s;

二者的最大区别是:但是我们却发现在表示byte时,都用unsigned char,这是为什么呢?首先我们通常意义上理解,byte没有什么符号位之说,更重要的是如果将byte的值赋给int,long等数据类型时,系统会做一些额外的工作。如果是char,那么系统认为最高位是符号位,而int可能是16或者32位,那么会对最高位进行扩展(注意,赋给unsigned int也会扩展)而如果是unsigned char,那么不会扩展。最高位若为0时,二者没有区别,若为1时,则有区别了。同理可以推导到其它的类型,比如short, unsigned short,等等。

        [FieldOffset(0)]
        public int i;
    }
这玩意是编译不通过的。然后折腾了半天,没有折腾出来。后来又回到C/C++想了一番,似乎有些认识。
C/C++用union其实就是使用同一块内存存储不同类型的数据,说白了,就是一块公用的内存,你用啥读取出来就是啥内容。其实计算机中的内存本身也就是这样,你定义一个int i;然后计算机会在内存栈上开辟一块空间,并且这块内存指明了是int类型,但是我们经常看到(int)data,(int*)pt等操作,说明可以强制转换。强制转换不是说把这几块内存的值改变了,只是临时改变了读取方式,然后用这种方式读取这块内存。那这样说来是不是也可以不用union来实现char数组与其他类型之间的转换,答案是必须可以。
比如:
    unsigned char chArr[4] = "";
    float f1 = 45.56f;
    memcpy(chArr, &f1, sizeof(float));
    // 运行结果:113    61    54    66
    printf("%dt%dt%dt%dn", chArr[0], chArr[1], chArr[2], chArr[3]);
    
    float f2 = 0.00f;
    memcpy(&f2, chArr, sizeof(float));
    printf("%0.2fn", f2);
    
    float f3 = *(float *)chArr;
    printf("%0.2fn", f3);

具体可以通过下面的小例子看看其区别

    char *pch = (char *)&f3;
    // 运行结果:113    61        54        66
    printf("%dt%dt%dt%dn", pch[0], pch[1], pch[2], pch[3]);

  include <stdio.h>

那好问题来了,C#怎么实现?
那好,答案也来了。当然是用BitConvert。
比如:
    float f = 45.56f;
    byte[] b = BitConverter.GetBytes(f);
    Console.WriteLine("bArrt: {0}t{1}t{2}t{3}", b[0], b[1], b[2], b[3]);

  void f(unsigned char v)
  {
    char c = v;
    unsigned char uc = v;
    unsigned int a = c, b = uc;
    int i = c, j = uc;
    printf("----------------n");
    printf("%%c: %c, %cn", c, uc);
    printf("%%X: %X, %Xn", c, uc);
    printf("%%u: %u, %un", a, b);
    printf("%%d: %d, %dn", i, j);
  }   

    float f2 = BitConverter.ToSingle(b, 0);
    Console.WriteLine("f2t: {0}", f2);
完全木有问题啊,而且还安全。

  int main(int argc, char *argv[])
  {
    f(0x80);
    f(0x7F);
    return 0;
  }

本文由网上澳门金莎娱乐发布于编程,转载请注明出处:基于C语言char与unsigned char的区别介绍

关键词: