自从GPT出现后,对于文本处理的能力直接上升了一个维度。在这之前,我们爬取到网络上的文本内容之后,都需要写一个文本清理的程序,对文本进行清洗,而现在,有了GPT的加持,我们只需要几秒,就可以很方便对所有类型,所有格式的文本内容,完成清洗,去除那些html标签等。对于清洗后的文章,我们仍然可以做很多事情,比如,提取核心观点,文章改写等操作,使用GPT都可以很轻松的解决。