快捷搜索:  汽车  科技

excel批量抓取多个网页数据(10秒钟搞定1800条无规则数据提取)

excel批量抓取多个网页数据(10秒钟搞定1800条无规则数据提取)怎么办?我的解决方案是尝试在Excel超能力插件中应用【正则提取】功能来实现智能提取,来看我的操作。这样的表,用常规方法来处理,花两天时间也搞不定!基本就八个字——束手无策,无可奈何!最近做会员答疑时遇到不少数据提取方面的问题,尤其是无规律数据的提取。比如,下面这个问题中,要求从A列文本中将规格信息提取出来,即单元格中类似AxB,或者AxBxC的信息。▲ 从A列数据中提取规格信息这个问题中,有几个难点,一起来看一下:

excel批量抓取多个网页数据(10秒钟搞定1800条无规则数据提取)(1)

文:徐军泰 首发:Excel同学会

数据提取 · Excel · 无规律 · 正则表达式

⏱5mins 读完,今天的文章绝对建议收藏


大家好,我是徐老师。

最近做会员答疑时遇到不少数据提取方面的问题,尤其是无规律数据的提取。比如,下面这个问题中,要求从A列文本中将规格信息提取出来,即单元格中类似AxB,或者AxBxC的信息。

excel批量抓取多个网页数据(10秒钟搞定1800条无规则数据提取)(2)

▲ 从A列数据中提取规格信息

这个问题中,有几个难点,一起来看一下:

  • A列文本长度无规律,要提取的规格数据位置不固定,因此使用函数法——No!行不通
  • 目标数据格式不统一,例如有的单元格内为AxB,有的为AxBxC,因此快速填充法——No!行不通
  • A、B、C的格式也不统一,有的只有数字,有的数字前面有φ符号,有的后面有mm,有的数字带小数点,有的不带……
  • 数据量大,整张表共有1800余行

这样的表,用常规方法来处理,花两天时间也搞不定!基本就八个字——束手无策,无可奈何!

怎么办?我的解决方案是尝试在Excel超能力插件中应用【正则提取】功能来实现智能提取,来看我的操作。

01

编写正则表达式

在"Excel中怎么提取不规则文本?一篇文章,快速学会正则表达式 正则提取"一文中,我们介绍了正则表达式的用法。

所谓正则表达式,说白了,就是对文本规律/规则的一种表达方法。只要我们能将要提取的目标文本的规则表达清楚,用正则表达式写出来,就有可能快速完成提取。

由于目标文本前面已经描述了,有可能是AxB,也有可能是AxBxC。A、B、C的主体是数字信息,因此最基本的正则表达式可以写为:

\d x\d (x\d )?

\d 代表至少1位数字,由于目标数据中A、B一定存在,但C不一定,因此(x\d )后面加?表示出现0次或1次。

有了基本的正则框架,现根据A、B、C内部格式的多样性特点,最终将本例的正则表达式写为:

φ?\d (\.\d )?(mm)?xφ?\d (\.\d )?(mm)?(xφ?\d (\.)?\d )?(mm)?

具体含义可对照"Excel中怎么提取不规则文本?一篇文章,快速学会正则表达式 正则提取"一文中的正则字符含义来理解。

excel批量抓取多个网页数据(10秒钟搞定1800条无规则数据提取)(3)

02

在Excel超能力中进行正则提取

1、在Excel超能力的【正则提取】框内,将已经编写的正则表达式粘贴进去,并按回车键;

excel批量抓取多个网页数据(10秒钟搞定1800条无规则数据提取)(4)

2、在弹出的对话框中选择要处理的区域,A3:A1802;

excel批量抓取多个网页数据(10秒钟搞定1800条无规则数据提取)(5)

3、确定后,在弹出对话框中选择结果保存的位置,这里选择B3单元格;

excel批量抓取多个网页数据(10秒钟搞定1800条无规则数据提取)(6)

再次点击确定后,超能力将进行自动处理。约3秒钟时间,即可完成自动提取。

excel批量抓取多个网页数据(10秒钟搞定1800条无规则数据提取)(7)

▲ GIF:操作演示

好了,今天的内容就介绍到这里,我是徐老师,感谢阅读。

如果文章有用,记得关注/收藏/转发。

关联阅读:

「数据提取」正则表达式:如何在Excel中实现精准提取


作者 徐军泰

——《左手数据,右手图表》作者,Excel同学会创办人,唯库、万门大学等平台特约讲师。

● 如何获取「Excel超能力」?

Excel超能力,是一款面向职场人的超实用Excel效率提升插件,同时兼容MSOffice和金山WPS。

插件意在提升Excel批量处理和操作方面的不足,弥补Excel在多表导航、密码管理等方面的功能,以及优化合并单元格等操作层面的体验,让用户具备Excel超能力!

excel批量抓取多个网页数据(10秒钟搞定1800条无规则数据提取)(8)

▲ Office安装效果

excel批量抓取多个网页数据(10秒钟搞定1800条无规则数据提取)(9)

▲ WPS安装效果

目前,插件已有包括Excel文本处理、数据录入、数据处理、格式转化、报表合并与拆分、(动态)图表制作、文件批处理、文档加密解密、图片批处理、个人账号密码管理、快捷键、自定义函数等在内的10余个功能模块以及200 个功能,覆盖90%以上的常用操作和应用场景,帮助用户快速解决问题,节省95%的操作时间。

关注我,私信回复:666,可自动领取。

猜您喜欢: