数据采集是指通过通过网络爬虫或网站公开API接口等方式从互联网中获取数据信息。该方法可以将非结构化的数据从网页中抽取出来,将其存储为格式统一的本地数据文件或存储到本地数据库中,以供后期数据分析使用。数据采集可以支持文件、图片、音频、视频等各种数据格式。