
亚太人文与艺术
Asia-Pacific Humanities and Arts
- 主办单位:未來中國國際出版集團有限公司
- ISSN:3079-3629(P)
- ISSN:3079-9554(O)
- 期刊分类:文学艺术
- 出版周期:月刊
- 投稿量:0
- 浏览量:573
相关文章
暂无数据
人机协同创作模式下数字插画的风格迁移与创新
Style Transfer and Innovation of Digital Illustration under Human-Computer Collaborative Creation Mode
引言
随着人工智能与数字艺术深度融合,Midjourney、Stable Diffusion、LibLib等AI图像生成工具快速迭代,推动数字艺术进入智能化创作阶段。传统创作模式下,数字插画与动态影像高度依赖创作者的手绘功底与软件技能,从构思到渲染全流程需独立完成,创作周期长、门槛高。AI技术的介入打破了这一格局,将基础绘制与风格模仿交由算法完成,创作模式从“人力单一主导”转向“人类创意主导+AI技术辅助”的人机协同范式,既提升了效率,也为风格创新提供了技术支撑。尽管AI为数字艺术带来高效便利,但当前风格迁移应用中的问题日益突出。多数工具停留在“关键词输入+一键生成”的浅层模式,过度依赖算法输出,弱化了艺术家的主体性与审美把控。AI生成逻辑以模仿现有风格为主,缺乏对个人艺术理念与情感表达的融合,导致作品风格雷同、同质化严重,难以形成独特艺术个性,也无法满足市场对原创性视觉作品的需求。基于上述问题,本文以人机协同创作为视角,聚焦数字插画与动态影像的风格迁移与创新路径展开研究。实践层面,构建系统化创作工作流,帮助创作者平衡AI效率与审美把控,突破同质化瓶颈,推动个性化创作;理论层面,重新梳理AI时代人与技术的关系,明确艺术家的核心定位,丰富AIGC时代数字艺术创作理论体系,为领域融合研究提供新思路。
一、文献综述
(一)风格迁移的发展
风格迁移是计算机视觉与AI艺术创作的重要方向,核心是在保留图像内容结构的前提下实现艺术风格的迁移与再现。随着深度学习发展,风格迁移经历了从卷积神经网络(CNN)到扩散模型的演进过程。
2015年,Gatys等人提出神经风格迁移(NST),首次利用预训练CNN实现内容与风格的解耦。内容通过网络高层特征表征,风格通过Gram矩阵刻画纹理分布,通过优化内容损失与风格损失完成融合。该方法验证了深度学习在艺术风格化上的可行性,但迭代速度慢、单模型仅支持固定风格、易出现构图扭曲,实用性有限。
为提升效率与泛化能力,后续研究转向端到端网络。Johnson等人提出基于感知损失的前馈网络,实现实时推理,但仍需为每种风格单独训练。Huang与Belongie提出AdaIN方法,通过特征统计量的仿射变换实现任意风格迁移,兼顾速度与灵活性。但此类方法对复杂风格表现力不足,结构可控性仍较弱。
潜在扩散模型(LDM)与Stable Diffusion的出现显著提升了生成质量与风格丰富度。其在低维潜在空间中完成去噪生成,支持高分辨率图像合成,并可通过LoRA实现低成本风格微调。但扩散模型随机性强、构图可控性差,难以满足设计领域的精度要求。ControlNet的提出有效解决了这一问题,通过边缘、深度等结构条件约束U-Net生成过程,在保留风格效果的同时实现精准构图控制,形成了从草图到成品的高效创作流程。
整体来看,风格迁移技术围绕效率、泛化性、质量、可控性持续迭代,从理论验证走向工程落地,从风格模仿走向可控创作。以Stable Diffusion结合ControlNet的生成框架已成为当前主流方案,也为本研究提供了关键技术支撑。
(二)人机协同创作研究
在人机协同创作领域,学界对“人机协同”与“共同创造”的讨论已从教育学习延伸至艺术创作实践。金涛与吴天生基于分布式认知理论与生成式学习机制,揭示了影响个体“生成式意义建构”质量的多重因素,其理论框架对理解人机协同艺术创作具有重要启示。
该研究指出,GAI支持与人机协同活动是产生高质量成果的必要条件。在艺术创作中,这意味着风格迁移工具与人机协同工作流程是产生创新性视觉作品的必要前提。其次,学习者的先前知识决定了GAI支持的方向与用途。迁移至艺术创作,创作者的视觉经验、绘画功底与审美判断直接影响其运用风格迁移工具的方式——AI工具的价值发挥程度,取决于创作者自身的艺术素养。第三,元认知能力对产出质量起直接决定作用。在艺术创作中,元认知体现为创作者对创作过程的监控、评估与调整能力,即人机协同中的“审美判断”与“过程调控”。此外,学习动机在协同过程中起到催化作用。动机越强,AI工具与人机协作的效能越显著。创作者对风格实验的探索欲与对技术工具的好奇心,会放大AI在灵感激发与风格突破方面的价值。最后,该研究归纳了三种高质量产出的条件组态——协同伙伴型、前馈引导型与反馈调节型,表明人机协同的成效路径是多元的。创作者可根据自身特点(强烈的创作动机、扎实的审美积累或出色的自我反思能力)找到适合的人机协同创作路径。
(三)现有研究存在的不足
现有研究虽从技术攻关与理论思辨双重视角取得了一定进展,但仍存在显著的研究盲区。技术维度的研究多集中于算法迭代与性能优化,核心关注技术的可行性与效率,却忽视了艺术创作的非线性逻辑与实践需求,导致技术成果与实际创作流程脱节,缺乏对创作环节的针对性指导。理论维度的研究则多以批判性反思为主,聚焦于技术介入下的审美异化、文化消解等价值议题,虽揭示了技术应用的潜在风险,但未能从实践层面提出化解矛盾的具体路径与操作范式。
更为关键的是,现有研究普遍存在技术—理论—实践的断裂问题,缺乏以创作者真实工作流为核心的整合性研究。现有成果未构建衔接技术工具与艺术表达的标准化体系,也未形成兼顾技术合理性与审美自主性的实践框架,难以支撑创作者在实际生产中实现技术应用与艺术价值的平衡。因此,现有研究尚无法为创作实践提供系统、可落地的方法论支持,成为制约相关领域高质量发展的核心瓶颈。
二、研究方法与人机协同工作流构建
(一)创作原则
本研究的人机协同工作流遵循四项核心原则:以艺术家审美控制为核心,AI作为协同者而非替代者,艺术家的审美判断与意图导向始终是作品艺术价值的决定因素;明确分工、发挥各自优势,AI承担高速度生成与风格迁移计算,艺术家承担审美判断、意图设定与细节修正,实现人机能力的互补配置;采用“生成→判断→修正→再生成”的迭代循环机制,在每一次反馈中逐步逼近艺术家的创作意图;所有技术手段(模型选择、LoRA、ControlNet等)的选择与参数设置均以具体的创作目标为导向,避免为技术而技术。
(二)工作流阶段划分
基于上述设计原则,本研究构建了基于LibLib平台的循环迭代工作流,分为四个阶段。
1. 概念生成
在LibLib“文生图”界面输入中文提示词(如“宋代山水,赛博朋克,霓虹灯”),选用基础模型,设置采样DPM++2M Karras、步数20-30、CFG7-9,批量生成4-8个方案。筛选2-4个潜力方向,记录构图与色彩特征,关注AI的“意外生成”,据此修改提示词并迭代。关键:艺术家通过提示词调整缩小探索范围,审美经验决定筛选与方向强化。
2. 风格控制
收集3-5张风格参考图上传至ControlNet(选择Canny或Scribble模式,权重0.6-0.8)。在模型库中选用对应LoRA(如“国风水墨”与“赛博朋克”,权重0.6-0.8)。生成后评估风格迁移效果,可使用“一键重绘”快速变体。关键:艺术家通过LoRA和ControlNet将审美意图转化为参数,LibLib降低技术门槛。
3. 人机迭代
保存初稿后,用Photoshop调整色彩、修正结构、强化元素,记录修正意图。将修正图上传至“图生图”(重绘幅度0.3-0.5),同步调整提示词,生成新版本。重复“人工修正→图生图反哺→AI生成”2-4轮,保存每轮节点。关键:艺术家的元认知能力(评估输出、判断修正方向)直接决定产出质量。
4. 最终整合
从多轮结果中提取满意局部,用LibLib“高清修复”增强。在Photoshop中分层合成优势元素,使用蒙版、混合模式融合,数位板手绘润色(强化笔触、修正边缘、增加细节),最后统一调色,导出高分辨率图像。关键:AI提供素材与可能性,最终的艺术统一性、情感表达与细节品质由艺术家完成。
三、创作实践与案例分析
案例:数字插画《赛博宋韵》
(一)创作目标
将宋代山水画的美学特征与赛博朋克视觉元素融合,保留“三远法”构图、笔墨意趣与留白意境,同时融入霓虹灯光等赛博符号,形成兼具古典意境与未来感的个人化风格。
(二)工作流应用过程
1. 概念生成
在LibLib“文生图”中输入提示词:“宋代山水画,范宽风格,高山远水,云雾缭绕,赛博朋克元素,霓虹灯,夜景,数字插画”。选用“画境东方 Vol .2-青绿国风赛博世界生成器”模型,采样DPM++2M Karras,步数25,CFG7.5,一次生成4个方案。筛选后,第2、4号方案较为协调,但分别存在山石过实、霓虹过喧的问题。修改提示词,增加“水墨笔触,淡彩,留白,柔和霓虹”,剔除“全息投影,机械结构”。
2. 风格控制
收集、赛伯朋克3张参考图,上传至ControlNet(Canny模式,权重0.7)。选用“国风山水”(0.65)与“赛伯朋克”(0.6)两个LoRA。生成结果保留宋代山水气势,霓虹以点缀方式出现,但部分结构扭曲(如山顶与灯带衔接不自然)。
3. 人机迭代
将初稿导入Photoshop,用液化工具调整扭曲结构,用画笔强化皴擦笔触,降低霓虹饱和度。修正后上传至“图生图”(重绘幅度0.4),调整提示词为“柔和霓虹,山水为主”。再次生成两个版本:版本A色彩统一性优,版本B山石质感更佳。经过3轮“人工修正→图生图反哺”循环,图像达到满意效果。
4. 最终整合
提取版本A的色调与版本B的山石纹理,在Photoshop中分层合成,用蒙版融合边缘,数位板手绘润色云雾、树丛,统一调色强化蓝橙对比,输出300dpi作品。
(三)创作思考
本案例验证了人机协同工作流的有效性:ControlNet与LoRA平衡了结构约束与风格自由度;多轮迭代使AI生成逼近创作者意图。宋代山水“留白”与赛博朋克“满幅”的冲突,通过降低霓虹密度、强化山石主体得以协调,这一决策依赖艺术家的审美判断,说明人机协同中“人”的核心地位不可替代。
四、结果分析与讨论
(一)人机协同数字插画创作的创新性总结
人机协同创作不仅能借助AI完成素材检索、基础构图与配色等基础工作,大幅提升插画创作效率、缩短迭代周期,让创作者专注创意构思;还能依托AI对海量艺术数据的学习,突破个人技法与审美局限,实现多元风格融合与视觉表现升级;同时AI生成内容的随机性还能带来富有艺术价值的意外效果,打破线性创作逻辑,激发新的创作灵感。
(二)人机协同创作工作流的局限性分析
AI插画创作存在明显局限:AI对人体结构、透视与细节把控精度不足,易出现画面问题且提示词难以精准表意,后期人工修正会增加创作成本;同时模型训练数据相近易导致作品风格同质化,还伴随原创性与版权争议,难以形成个人艺术标识;此外,高质量生成对算力要求高、部分模型需付费,且提示词与模型调试存在学习门槛,软硬件及学习成本限制了其普及。
(三)人机关系与艺术家创作角色的再思考
在人机协同创作中,AI本质是高效技术辅助工具,不具备情感与创作意识,无法脱离艺术家主导成为独立合作者;艺术家的角色也从兼顾创意与绘制,转向创意决策、内容筛选与艺术价值赋予,核心价值从技法执行转为把控立意、情感与风格;而艺术创作的核心仍回归人本,AI无法替代人的经历、情感与人文思考,作品的精神内核依赖创作者赋予,需平衡技术与艺术主体性,防止创作流于表面。
五、结论与展望
(一)研究总结
本研究针对传统数字插画创作效率低、风格拓展难等问题,提出四阶段人机协同插画创作工作流,涵盖概念生成、风格控制、迭代修正、最终整合四个核心环节,通过实际创作实践,验证了该工作流能有效提升创作效率、突破风格局限,同时也厘清了当前人机协同创作的优势与现存局限性。
(二)研究贡献
本研究构建了可落地的人机协同插画创作实操流程,明确各环节人机分工与执行方法,为数字媒体艺术创作实践提供了具象化的参考范例,助力创作者规范运用AI进行插画创作,同时丰富了AI与数字媒体艺术交叉领域的实践研究内容,为相关艺术创作与教学提供了新思路。
(三)未来方向
随着AI技术不断发展,人机协同创作将迎来更多可能:一方面可实现实时协同,达成艺术家创意与AI生成的同步联动,优化创作流畅度;另一方面可推进多模态融合,结合语音、动作等交互方式,降低创作门槛,拓展艺术表达维度;此外,还可优化AI模型的细节把控与个性化风格生成能力,进一步完善人机协同创作体系。
参考文献:
- [1] Gatys L A, Ecker A S, Bethge M. A neural algorithm of artistic style[J]. CoRR,2015.
- [2] Johnson J, Alahi A, Fei-Fei L. Perceptual losses for real-time style transfer and super-resolution[C]//European conference on computer vision. Springer, Cham,2016.
- [3] Huang X, Belongie S. Arbitrary style transfer in real-time with adaptive instance normalization[C]//Proceedings of the IEEE international conference on computer vision.2017.
- [4] Rombach R, Blattmann A, Lorenz D, et al. High-resolution image synthesis with latent diffusion models[C]//Proceedings of the IEEE/CVF conference on computer vision and pattern recognition.2022.
- [5] 郝晶平. AIGC技术在数字插画创作中的协同应用研究[J]. 大观,2025(09):93-95.
