字符串处理

MATLAB

拆分
  • 正则表达式函数regexp的split模式 S = regexp(str, char, 'split')

  • 在指定的分隔符处拆分字符串 strfind C = strsplit(str) 在空白处将 str 拆分为 C。空白字符等效于集合 {’ ‘,’\f’,’\n’,’\r’,’\t’,’\v’} 中的任何转义序列。 C = strsplit(str,delimiter) 在 delimiter 指定的分隔符处拆分 str。 C = strsplit(str,delimiter,Name,Value)使用一个或多个名称-值对组参数指定其他分隔符选项。 [C,matches] = strsplit(___) 还返回数组 matches。matches 输出参数包含 strsplit 拆分 str 时遇到的所有分隔符。您可以将此语法与前面语法中的任何输入参数结合使用。

  • 拆分字符串数组中的字符串 split newStr = split(str) 在空白字符处拆分 str 并以输出数组 newStr 的形式返回结果。 newStr = split(str,delimiter) 在 delimiter 指定的分隔符处拆分 str 的每个元素。输出 newStr 不包括分隔符。 newStr = split(str,delimiter,dim) 将 str 的每个元素拆分为一个向量,该向量的方向为 dim 指定的维度方向。

  • 所选的字符串部分 strtok strtok(str) 从左到右解析 str,使用空白字符作为分隔符,并在 token 中返回部分或全部文本。

查找
  • 在一个字符串内查找另一个字符串 strfind
判断
  • 比较字符串 strcmp
联接
  • 联接数组中的文本 strjoin

PYTHON

拆分
  • split() 方法可以将长字符串拆分成一个列表。split() 方法可接收两个参数,第一个参数是分隔符,即用来分隔字符串的字符,默认是所有的空字符,包括空格、换行( )、制表符( )等。拆分过程会消耗分隔符,所以拆分结果中不包含分隔符。split() 方法的第二个参数是一个数字,默认是缺省,缺省时全分隔,也可以用 maxsplit 来指定拆分次数。split() 方法是从左往右遍历,与之相对,rsplit() 方法是从右往左遍历,比较少用。

  • splitlines() ,这个方法会按行拆分字符串,它接收一个参数 True 或 False ,分别决定换行符是否会被保留,默认值 False ,即不保留换行符。

替换
查找
  • 正则表达式

  • re模块 re 模块则提供了 match() 、find() 及 findall() 等方法

判断