一文详解C语言char类型中的存储

char是如何存储的 字符型(char)用于储存字符(character),如英文字母或标点。但是char类型在内存中并不是以字符的形式储存,而是以ASII码的

char是如何存储的

字符型(char)用于储存字符(character),如英文字母或标点。但是char类型在内存中并不是以字符的形式储存,而是以ASII码的形式储存,也可以说char类型储存的实际上是整数。所以char类型也被归类为整形家族。

int main()
{
	char c = 'A';
	printf("%d\n", c);
	printf("%c\n", c);
	return 0;
}

从上面的代码可以看出,因为char类型储存的是整形,所以可以以正数的形式打印出


打开内存窗口,也可以看出char是以整数的形式存储:

既然知道char实际上是整形,所以也可以用int类型对char类型赋值

int main()
{
	char c = 65;
	printf("%d\n", c);
	printf("%c\n", c);
	return 0;
}

%d输出就是输出存储在内存中的整形,以%c输出就会输出初始化时整数对应的ASKII码字符

其实关于由int类型对char赋值,以及对于char类型之间的运算,其实都会经历一个操作叫做:整形提升,整形提升的详细介绍在另一篇文章里点击跳转

char的类型

当听到char的类型这句话时,第一反应应该会是:“char的类型不就是char嘛”

其实不然,char类型实际上分区为有符号的signed char和无符号的unsigned char

你可能对有无符号可能会陌生,对于有无符号我在另一篇文章里详细介绍了点击跳转

对于char的有无符号位比较特殊的是:

  • charsigned char不一定等价
  • char默认是signed char还是unsigned char取决于编译器
  • 在常见的编译器里,char类型都默认为signed char

char的取值范围

char类型占1个字节,也就是8个比特位

所以char在内存中以00000000开始,逐渐递增,到011111111,在增加到100000000,最后到11111111,如下图:

对于signed char来说:

00000000为0,逐渐递增到011111111为127,因为第一位是符号位,所以再+1后的100000000为负数。
从最下面的开始算,11111111为-1,向上逐渐递减,到100000001时,为-127,所以100000000为-128。

所以,有符号的char的取值范围是:-128 ~ 127

对于unsigned char来说:

当二进制最高好比特位的数为0时,无符号的char与有符号的char相同,当制最高好比特位的数为1时,因为是无符号的char,所以100000000为128,直到11111111为255

所以,无符号的char的取值范围是:0 ~ 255

下面这幅图可以形象地表示出char类型数据范围

其实,这个图还可以体现出char类型的“循环”
在给char类型赋值为超过它的取值范围的值时,在char中的会按照图中的循环方向进行存储值,这其实是由于整形提升导致的,但是通过照着这个图会比分析整形提升的过程更方便得出实际char中的值

int main()
{
	char c = 129;
	printf("%d", c);
	return 0;
}

这个程序输出是-127,而不是129

此代码中,char类型默认是有符号的char,它的取值范围是-128 ~ 127,但是给c赋值为129,超出了取值范围
所以照着图就可以看出:129超了127两位,在图里127向后走两位就是-127

无符号整形也是如此。

例题

例1

//输出什么?
#include <stdio.h>
int main()
{
  char a= -1;
  signed char b=-1;
  unsigned char c=-1;
  printf("a=%d,b=%d,c=%d",a,b,c);
  return 0;
}

在这里charsigned char是一个意思,有符号的char取值范围是-128 ~ 127,-1在这个范围中,所以a,b 都输出 -1

无符号的范围是0 ~ 255,-1不在这个范围里,根据起面的循环图,c中存放的是255

例2

//输出结果是什么?
int main()
{
  char a[1000];
  int i;
  for(i=0; i<1000; i++)
 {
    a[i] = -1-i;
 }
  printf("%d",strlen(a));
  return 0;
}

答案是:255

因为strlen是遇到\0就结束,也就是遇到0就结束

a[i]的值从-1,-2,-3到-128,再到127,126……0

这之间一共有255个数,所以结果是255

例3

//输出结果是什么?
#include <stdio.h>
unsigned char i = 0;
int main()
{
  for(i = 0;i<=255;i++)
 {
    printf("hello world\n");
 }
  return 0;
}

答案是:死循环

因为这里的i是无符号的char,范围是0 ~255,随着for循环的进行,当i==255时,再加1,i变为0,仍然小于255,所以是死循环

附:关于转义字符的内容

void main()
{
    //char a = '\'',b='\\',c='\r';//  \是转义符
    //cout << a << endl;
    //cout << b<< endl;
    //cout << c << endl;
    //int x = 'avb';
    //int y = 'a';
    //int z = 'v';
    //int f = 'b';
    //int h = y*z*f;
}

char a = ‘’’,b=’\’,c=’\r’; \是转义符

通过转义符可以得到某些特殊的字符的本身

如果只是简单赋值如:char ch=‘’‘;想得到一个单引号字符,这样的操作是无法通过编译的。

例如我们想要在字符串中输入一个特殊的名字如:“c++“hm”

如果简单的写为:char str[30]={" llj “c++ "hm "};这样是无法得到正确的答案的

我们需要使用转义符

char str[30]={" llj \“c++ \"hm "}

这样使用转义符,就可以把某些界限符的意义转为其他含义,如’ ‘是字符的界限符,” “是字符串的界限符。

再举一个例子:int x='4';那么x的值为字符4对应的ascii值

但是如果写为 int x=’\4’;那么x的值就为4。

int x="\1\2\3\4\5\6\7"[2];

上面x的值为3;

首先整个字符串通过转义变为了“1234567”这样七个字符,而后面的[2]则是代表着下标访问第二个数据,所以得到的刚好是第三个字符3;之所以能访问是因为,在这个字符串中\1\2\3等每个数都为一个字节,那么下标2,相当于第三个数,也就是第三个字节的内容。

总结

到此这篇关于C语言char类型中的存储的文章就介绍到这了,更多相关C语言char类型存储内容请搜索好代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持好代码网!