ES6 字符串和正则表达式(三)
发布日期:2021-05-06 20:27:21 浏览次数:19 分类:技术文章

本文共 2148 字,大约阅读时间需要 7 分钟。

更好的Unicode支持

早期,由于存储空间宝贵,Unicode使用16位二进制来存储文字。我们将一个16位的二进制编码叫做一个码元(Code Unit)。

后来,由于技术的发展,Unicode对文字编码进行了扩展,将某些文字扩展到了32位(占用两个码元),并且,将某个文字对应的二进制数字叫做码点(Code Point)。

ES6为了解决这个困扰,为字符串提供了方法:codePointAt,根据字符串码元的位置得到其码点。

同时,ES6为正则表达式添加了一个flag: u,如果添加了该配置,则匹配时,使用码点匹配

const text = "𠮷"; //占用了两个码元(32位)console.log("字符串长度:", text.length);console.log("使用正则测试:", /^.$/u.test(text));console.log("得到第一个码元:", text.charCodeAt(0));console.log("得到第二个码元:", text.charCodeAt(1));//𠮷:\ud842\udfb7console.log("得到第一个码点:", text.codePointAt(0));console.log("得到第二个码点:", text.codePointAt(1));/** * 判断字符串char,是32位,还是16位 * @param {*} char  */function is32bit(char, i) {
//如果码点大于了16位二进制的最大值,则其是32位的 return char.codePointAt(i) > 0xffff;}/** * 得到一个字符串码点的真实长度 * @param {*} str */function getLengthOfCodePoint(str) {
var len = 0; for (let i = 0; i < str.length; i++) {
//i在索引码元 if (is32bit(str, i)) {
//当前字符串,在i这个位置,占用了两个码元 i++; } len++; } return len;}console.log("𠮷是否是32位的:", is32bit("𠮷", 0))console.log("ab𠮷ab的码点长度:", getLengthOfCodePoint("ab𠮷ab"))

更多的字符串API

以下均为字符串的实例(原型)方法

  • includes

判断字符串中是否包含指定的子字符串

  • startsWith

判断字符串中是否以指定的字符串开始

  • endsWith

判断字符串中是否以指定的字符串结尾

  • repeat

将字符串重复指定的次数,然后返回一个新字符串。

实例:

const text = "老李头快不行了";  console.log("是否包含“李”:", text.includes("李"));console.log("是否以“老”开头:", text.startsWith("老"));      console.log("是否以“了”结尾:", text.endsWith("了"));      console.log("重复4次:", text.repeat(4));

3-3. [扩展]正则中的粘连标记

标记名:y

含义:匹配时,完全按照正则对象中的lastIndex位置开始匹配,并且匹配的位置必须在lastIndex位置。

const text = "Hello World!!!";const reg = /W\w+/y;reg.lastIndex = 3;console.log("reg.lastIndex:", reg.lastIndex)console.log(reg.test(text))

模板字符串

ES6之前处理字符串繁琐的两个方面:

  1. 多行字符串
  2. 字符串拼接

在ES6中,提供了模板字符串的书写,可以非常方便的换行和拼接,要做的,仅仅是将字符串的开始或结尾改为 ` 符号

如果要在字符串中拼接js表达式,只需要在模板字符串中使用${JS表达式}

3-5. [扩展]模板字符串标记

在模板字符串书写之前,可以加上标记:

标记名`模板字符串`

标记是一个函数,函数参数如下:

  1. 参数1:被插值分割的字符串数组
  2. 后续参数:所有的插值
    let love1 = "秋葵";let love2 = "香菜";let text = `老李喜欢${
    love1}阿忠也喜欢${
    love2}表达式可以是任何有意义的数据${
    1 + 3 * 2 / 0.5}表达式是可以嵌套的:${
    `表达式中的模板字符串${
    love1 + love2}`}\n\n········在模板字符串中使用\${
    JS表达式}可以进行插值`;console.log(text);
上一篇:ES6 函数模块(四)
下一篇:ES6 块级绑定(二)

发表评论

最新留言

路过,博主的博客真漂亮。。
[***.116.15.85]2025年03月10日 12时25分47秒