人工智能的四种能力人工智能三大阶段

Mark wiens

发布时间:2023-12-01

  2022年11月,OpenAI研发了人工智能技术驱动的自然语言处理工具 ChatGPT,开启了一种全新的检索信息和交流方式,它可以与人类互动,甚至能撰写影视脚本、文案、代码、论文等工作人工智能三大阶段

人工智能的四种能力人工智能三大阶段

  2022年11月,OpenAI研发了人工智能技术驱动的自然语言处理工具 ChatGPT,开启了一种全新的检索信息和交流方式,它可以与人类互动,甚至能撰写影视脚本、文案、代码、论文等工作人工智能三大阶段。ChatGPT 短短上线个月,月活跃用户就已成功过亿。它能够通过学习人类语言和理解上下文来实现对话互动,敢于质疑与承认错误。

  AI在电影方面的应用引发了业内的思考,上海温哥华电影学院电影制作系的高级讲师奥黛·阿瓦迪亚注意到AI的最新趋势,在去年12月底研发了专门的AI课程人工智能三大阶段,今年新学期开始开设,这项课程能让学生在实际拍摄中熟练应用AI技术。

  在她的课堂上,学生通过AI图像生成软件Midjourney,输入关键词来帮助他们生成电影的效果图。例如,为了生成克林特·伊斯特伍德的“中国版”演员,学生需要输入详细的关键词,如“35毫米镜头拍摄”、“浅焦”、“特写照片”等,这样才能获得符合电影行业规范的图像。这表明AI的可行性在电影美术方面已经初见端倪。

  Midjourney的应用为电影从业者提供了一个实验性的平台,帮助他们更有效地创建图像,满足电影制作的需求。通过利用AI生成图像,电影制作师可以更快速地获得所需的素材,提高工作效率。此外,AI还可以在创作过程中提供创意的灵感,为电影制作注入新的思维。

  但是电影最终的呈现不仅是由视觉效果组成的,尽管AI在美术构建方面的应用已经取得了一些显著进展,但电影是综合了多种艺术形式的综合体。所以在剧本创作、角色表演、导演指导和后期剪辑等流程中,AI的创作仍然面临诸多挑战。

  早在Midjourney等AI软件爆火前人工智能的四种能力,AI创作电影的实验已经在国内开启,并出现多个维度的创新。中国知名当代艺术家徐冰的《人工智能无限电影(AI-IF)》项目是一个突出的例子,它始于2017年,这个项目是由艺术家与人工智能科学家合作开发的。它引发了人们对电影创作方式的重新思考。

  在这个项目中,通过自动文本生成、场景生成、对话生成以及视频检索、文本语音合成及音乐合成方面的研究,实施了最先进的深度学习算法,构建了一个能够在没有剧组人员的情况下实时出品电影、并与观众互动的软件系统,完全由AI来创造电影内容。

  影片最终呈现的视觉画面是由人工智能算法根据观众偏好,从新闻和互联网内容中选择并捕获的相关视频片段中创建并编辑生成的。

  在2021年的平遥国际电影节上人工智能三大阶段,徐冰与团队首次向观众发布了可与观众交互的AI电影版本。观众可以在电脑页面上选择电影类型和片长,并通过输入关键词或句子,即可生成由AI创作的永不重复的电影。此外,观众还可以在播放中输入新词汇,改变电影中的角色和叙事情节,使观众成为电影创作者的一部分。

  《人工智能无限电影》解决的是:作为媒介、作为技术载体的电影,如何生成自身的问题。这部电影牵涉到四个技术框架:剧本模型;视频字幕模型;有匹配生成的剧本与视频字幕;生成对话音频与背景音乐的模型。这个技术框架其实最难的点不是每个单独的机器学习模型的控制,而是这四个不同的算法模型如何相互协作,产生一系列的反馈回路。

  基于以上提到的四个框架,研发团队做了许多组不同的测试。针对最初使用NLP (Natural Language Processing)自动生成的剧本模型,他们基于剧本对格式和上下文约束(Context Constraints)敏感度的需求,最终选择了开源的Open AI的GPT-2。算法对剪辑出来的有意义的片段再进行标注。

  标注内容时,他们主要选择了六个参数:人物人工智能三大阶段、地点、人数、视频中发生的内容、动作及物件。基于这些参数,算法再将匹配度最高的剧本模型和视频模型进行匹配,最后加入自动生成的对话和背景音乐,根据观众最初输入的句子内容,输出最后的影片。

  可以看到《人工智能无限电影(AI-IF)》代表了AI在电影领域的前沿应用,但也突出了AI创作电影的潜在限制。尽管AI在生成电影内容方面具有潜力,但它仍然需要人类来设定参数和提供关键信息,从而引导电影的创作过程。这强调了AI和人类的互补性,而不是替代性。此外,AI生成的电影内容可能会缺乏情感、创造力和人类的主观性,这是电影制作的核心元素之一。

  电影理论大师巴赞曾说“电影是现实的渐近线。”随着AI技术的不断发展,电影制作者也要面临“真实世界”与“虚拟世界”的建构与融合。即便AI掌握了生活逻辑、人性逻辑、艺术真实法则,AI仍然无法替代人类去创作电影。其实这在某种程度上是人类与AI之间的关系在电影创作中的分工合作,共同完成电影世界的塑造。

  目前的AI主要是运用在电影特效中,它可以制造电影叙事的必要氛围,也可以单独成为独立的世界人工智能的四种能力。在电影《沙丘》中导演维伦纽瓦运用大量的AI 特效来塑造影片的主要叙事线——“梦境”,男主角保罗总在梦中看到零散又朦胧的场景,如茫茫无垠的沙漠、蓝眼睛的弗雷曼女孩和若隐若现的厄拉科斯星球。

  电影中AI特效呈现的巨大沉默物体实质是在物与物之间形成的一种视觉修辞。它即是宏伟的、浩瀚的,也是渺小的、细微的。这些发散的、流动的、无序的梦就像漂浮在他意识中的碎片,是刻画人物形象的重要环境氛围。

  与之将AI特效融入主角真实生活的方式不一样,电影《刺杀小说家》则是利用AI制作了另外一个世界。影片讲述父亲关宁为了失踪的女儿去刺杀小说家,而小说家正在写的故事却与关宁的生活轨迹神似,于是,梦境、故事世界、现实世界三者相互平行影片由现实主义风格的现实世界和奇幻建构的超现实世界构成,两者相互并置,平行运行。

  超现实世界主要由AI数字技术驱动,比如数据及信息收集、动作捕捉和虚拟拍摄、纯粹虚拟拍摄制作、虚实结合虚拟拍摄、数字生物及类人生物制作、数字灯光系统等等。这些方法让观众在视觉上能明显区别AI世界和现实世界,强调影片与观众的互动,包括身体沉浸式体验两个世界里所发生的故事。

  所以电影带来的真实感并不是狭义上的无限接近现实,而是创造出让观众能够相信的“真实世界”。AI创作给电影的真实带来更多元化的可能性,社会现实只是电影叙事中的结构性元素,最终臣服于感官性现实之中。

  前文所提到的Midjourney的人工智能程序选择在素材库中使用无版权的图片,以规避版权争议。美国政府发布的3月16日 《联邦公报》 (Federal Register) 显示,美国版权局 (USCO)在发布的美国联邦法规 (Code ot Federal Regulations, CFR) 第202部分 《版权注册指南》 中,明确A自动生成的作品不受版权法保护。

  对于Al生成内容的版权认定标准为:如果一个作品的所有要素都由机器产生,没有人类行为者的任何贡献,则不符合版权登记资格。在版权局看来,版权只能保护人类创造力的产物,与美国宪法和 《版权法》将“作者”一词限定在“人类”范围内保持一致。

  版权问题一直是艺术创作中不可避免讨论的问题,新事物诞生的同时也需要完善相对应的法律法规和政策人工智能的四种能力。随着AI创作的不断发展,有必要制定对其创作的作品予以保护的法律。电影产业的健康和可持续发展是文化产业的重要组成部分,它不仅是一项具有商业价值的行业,还承载着文化传承和创意表达的使命。在数字化时代,技术融合和AI技术的广泛应用已经深刻改变了电影制作、分发和观众互动的方式。然而,正如所提到的,妥善解决版权保护问题成为电影行业有效利用AI技术优势的关键一步。

  周婉京.从“蜻蜓之眼”到“AI之眼”——论徐冰《人工智能无限电影》背后的视觉机制[J].北京电影学院学报,2022(09):50-57.

  周文姬.胶片、数字代码、GPT类AI:电影中的现实转向和变体[J].当代电影,2023(09):69-76.

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186