据据a href="//www.pumpym.com/de/insights/articles" target="_blank" class="rich-text-a-tag">Zurück祖ARTIKEL据/a>
von.据a href="//www.pumpym.com/profiles/danilo-sato" target="_blank" class="rich-text-a-tag">Danilo Sato.据/a>那据a href="//www.pumpym.com/profiles/arif-wider" target="_blank" class="rich-text-a-tag">阿里夫更宽据/a>和据a href="//www.pumpym.com/profiles/christoph-windheuser" target="_blank" class="rich-text-a-tag">Christoph Windheuser据/a>
Veröffentlicht:5.巨力2019据/p>
In der heutigen Softwareentwicklung ist es selbstverständlich geworden, dass Usern laufend neue Funktionen und Erweiterungen geboten werden. Das trifft sowohl bei Benutzeranwendungen im Mobil-, Web- und Desktop-Bereich zu als auch bei moderner Unternehmenssoftware. Umfangreiche und den Betrieb störende Software Go Lives werden nicht mehr geduldet. Thoughtworks ist ein Pionier bei Continuous Delivery (CD), einer Reihe von Prinzipien und Praktiken, die die Frequenz mit der Software zuverlässig produktiv ausgeliefert werden kann, drastisch erhöhen.据/p>
Data-Science- and Data-Engineering-Ansätze in die Softwareentwicklung einfließen zu lassen, damit keine spezialisierten Silos entsteen, die eine effiziente Zusammenarbeit verhindern。alldings ist diese Integration auh mit neuen Hürden verbunden:据/p>
梅尔Artefakte,死亡SICHverändern。据/strong>Esmüsennichtnur Die Softwarecode-Artefakte Verwaltet Werden,Sondern Auch DieDenbasis und Machine Learning(ML)-Modelle Sowie Die在Den Modellen Verwendeten参数undparameter。SämtlicheDieserArtefakteMüsenüberverchiedeneStufenHinweg Accormentiert,Versioniert Und Optimiert Werden,Bis Sie在ProduktionÜbernommenWerden。Die Sichersthung von Svensiveierung,Qualitätskontrolle,Zuverlässigkeit,WiederhelbarkeitundPrüffähigkeitStaweraherAufwändigerund Komplexer。据/p>
格罗斯UNDÜbertragbarkeit。据/strong>模具Größenordnung冯Trainingsdaten UND ML-Modellen liegt IM Allgemeinen deutlich尤伯杯德·冯·Softwarecode。Insofern信德献给EINE effiziente Handhabung ANDERE WERKZEUGE erforderlich。erschwert死Nutzung EINES universellen Artefakt的格式模具,是祖einer“尤伯杯巢穴祖安维尔芬”-Mentalitätzwischen巢穴verschiedenen队führen卡恩。据/p>
UnterschiedlicheFähigkeitenUND Arbeitsmethoden德Mitarbeiter。据/strong>毛皮死发展协会冯ML-Anwendungen werdenFachkräfteMIT SICHergänzendenFähigkeitenbenötigt。Mitunter haben dieseFachkräftegegensätzlicheZielsetzungen,Ansätze奥德Arbeitsmethoden:据/p>
持续交付机器学习(CD4ML)IST DER TECHNISCHE拟设,麻省理工学院的马克dieser Problematik entgegengewirkt werden远洋地产。CD4ML bringt模具verschiedenen GRUPPEN一个einen蒂施,sodass SIE ML-Anwendungen entwickeln,bereitstellen UND kontinuierlich verbessernkönnen。据/p>
我是据a href="//www.pumpym.com/insights/blog/intelligent-enterprise-series-models-enterprise-intelligence" target="_blank" class="rich-text-a-tag">ersten ARTIKEL据/a>DER Reihe街上据em style="background-color: transparent;color: rgb(0,0,0);">聪明的企业据/em>haben WIR巢穴连续情报-Zyklus vorgestellt(世赫Abbildung 2)。据/p>
Hierbei handelt ES SICH嗯einen Prozess,DER在irgendeiner形式快速jedem Unternehmen existiert,und明镜DAS ZIEL帽子gesammelte回到名单Daten往昔在信息详细信息UND丹恩在Erkenntnisse UNDMaßnahmenumzuwandeln,嗯所以datengestützteEntscheidungen祖ermöglichen。在traditionellen Organisationen basiert dieser Zyklus奥夫Altsystemen(魏数据仓库奥德ERP-Systemen)UND Entscheidungen第三人以Menschen。在Diesen表示Organisationen IST DER Prozess langwierig UND hakt的etlichen Stellen:ML-Anwendungen werden经常losgelöstentwickelt UND kommen聂尤伯杯模具证明了概念相hinaus。Schaffen SIE EStatsächlich二楚PRODUKTION,handelt ES SICH经常嗯EINE einmalige Angelegenheit。达斯Aktualisieren UND Neutrainieren gestaltet SICH schwierig,所以DASS Modelle秃veraltet UNDüberholt信德。据/p>
Intelligente Unternehmen WISSEN,魏某SIE书房连续智能-Zyklus beschleunigen UND Reibungspunkte beseitigenkönnen。CD4ML IST DER TECHNISCHE拟设楚schnellerenWertschöpfung冯ML-Anwendungen IM拉赫曼DES持续情报,Zyklus。CD4ML马赫特ESmöglich,冯下线Modellen UND manuellen Implementierungen wegzukommen,书房Prozess DERdatengestütztenGewinnung冯信息详细信息,Erkenntnissen UND Entscheidungen奥夫ganzer临界线祖automatisieren,UND daraus WIEDER回到名单Daten祖erfassen,麻省理工学院的田园SICH死Ergebnisse MESSEN拉森。所以卡恩DER连续智能-Zyklus schneller durchlaufen werden。第三人以BerücksichtigungDES反馈IM Prozess拉森SICH zudem qualitativ bessere Ergebnisse贝geringerem Risiko erzielen。据/p>
CD4ML IST EINE ANWENDUNG UND ERWEITERUNG VON连续交付(CD)。在Ihrem Wegweisenden Buch Definierten Jez Humber Und David Farley连续送货Als SoftwareTwickLungsansatz,Bei Dem Teams软件在Kurzen Zyklen Produzieren,Sodass Die Software JederzeitZuverlässigAusgeliefert Werden Kann。BewerkstelligenLässtICHIICEDICEDENENWiederharbaren,Zuverlässigen分娩FürIeduplyStellung,DorchEineMöglichstWeitreichendeAutomatisierung unch Fokussierung AufQualität。据/p>
谦卑UND法利zufolge IST持续交付模具Fähigkeit,Änderungenjeglicher艺术(einschließlich诺伊尔Funktionen,Konfigurationsänderungen,Fehlerkorrekturen UND experimentellerÄnderungen)在PRODUKTION祖bringen bzw.一个模具Anwenderつübergeben - 西歇尔,施耐尔UND nachhaltig。据/p>
Änderungen的巢穴ML-Modellen信德lediglich EINE weitere技术冯Änderungen,模具verwaltet UND ausgeliefert werdenmüssen。模具existierenden CD-Techniken UND -Werkzeugemüssenjedoch erweitert werden,嗯奥赫MIT Diesen表示Artefakten umgehen祖können。Außerdemwird DER gesamte Softwareentwicklungszyklus komplexer,在einem哒模具Teammitglieder交叉-funktionalen小组(数据科学家,工程师数据,EntwicklerInnen UND ML-工程师)unterschiedliche Kompetenzen UND Vorgehensweisen mitbringen。据/p>
188bet宝金博app下载ThoughtWorks的帽子书房连续交货,拟设weiterentwickelt,sodass呃SICH奥赫奥夫ML-Anwendungen anwendenlässt,UND bezeichnet Diesen表示neuen拟设ALS机器学习(CD4ML)持续交付。模具定义冯持续交付wird嗯抵达Neue元素系列erweitert,死楚Beschleunigung DES持续情报,Zyklusnötig信德:据/p>
机器学习(CD4ML)持续交付IST EIN Softwareentwicklungsansatz,贝DEM EIN跨funktionales队ML-Anwendungen entwickelt,死AUF代码,回到名单Daten UND Modellen basieren;UND zwar mittels克莱纳,inkrementellerÄnderungen,模具jederzeit reproduzierbar UNDzuverlässigausgeliefert werdenkönnen,在kurzen Adaptionszyklen。据/q>
Diese定义umfasst全部wesentlichenGrundsätze:据/p>
Softwareentwicklungsansatz据/strong>。团队könnendamit effizient hochwertige软件erzeugen。据/p>
跨funktionales队。据/strong>FachkräfteMIT unterschiedlichenFähigkeitenUND的工作流程,模具SICH尤伯杯数据工程,数据科学,发展协会,Betrieb UND ANDERE Wissensbereiche erstrecken,arbeiten工程同侧,sodass死Kompetenzen UNDStärken德einzelnen Teammitglieder的Zum Tragen kommen。据/p>
Erzeugung von软件AUF der Grundlage Von代码,Daten And ML-Modellen。据/strong>Jedes Artefakt DES Softwareentwicklungsprozesses(代码,回到名单Daten,Modelle,参数)setzt bestimmte WERKZEUGE UND工作流程voraus UND搞乱entsprechend verwaltet werden。据/p>
克莱,inkrementelleÄnderungen。据/strong>Die Entwicklung und Auslieferung von Software-Artefakten Ist在KleinschrittigeÄnderungenunterteilt。DiesGewährleistet透明und Kontrolle Hinsichtlich der Auswirkungen DieserÄnderungenund Macht Den Prozess Secherer。据/p>
R.据/strong>eproduzierbare UNDzuverlässigeSoftwareauslieferung。据/strong>Der Prozess zur Auslieferung producktionsreifer Software ist zuverlässig and reduzierbar。我们的工作是自动化的。Alle Artefakte(代码,数据,模型,参数)verfügen über eine entsprechende Versionsverwaltung。据/p>
Jederzeitige Softwareauslieferung。据/strong>Wichtig Ist,Dass Die Software Jederzeit Produktionsreif AusgeliefertWerdenKönnte。Selbst Wenn Consorisationen Nicht Laufend SoftwareAusliefernMöchten - Durch DieAuslieferungsfähigkeitIstDasTatsächlicheFreigabedatumeineGeschäftsentscheidungundshineTechnische。据/p>
Kurze Adaptionszyklen。据/strong>Kurze Entwicklungszyklen spielen SICH在einerGrößenordnung冯塔根奥德Stunden anstatt冯Wochen,Monaten奥德噶尔Jahren AB。大足bedarf ES EINES automatisierten Prozesses,einschließlichintegrierterQualitätssicherungen。所以entsteht EINE Feedbackschleife:SIE ziehenRückschlüsseAUS DEM Verhalten德produktiven软件和könnenIHRE Modelle entsprechend anpassen。据/p>
CD4ML dient dazu, den ML-Lebenszyklus durchgängig zu automatisieren and einen kontinuierlicen, reibungslosen Prozess gewährleisten: von der Datenerfassung über as Modellieren and Experimentieren zur Lenkung and weiter zum Produktiveinsatz。在Abbildung 3 wid der gesamte Prozess übersichtlich dargestellt。据/p>
Zusammenspiel DER Komponenten据/h4>
在德Darstellung beginnt德Zyklus链接。数据科学家befassen SICH麻省理工学院回到名单Daten,模具SIE在verschiedenen Datenquellen vorfinden UND abrufen。SIE extrahieren Merkmale,unterteilen模具回到名单Daten在Trainings- UND Testdaten,ERSTELLEN Modelle UND experimentieren MIT ihnen。SIE schreiben代码,嗯死Modelleつtrainieren(häufig在Python奥德R),UND optimieren diese Modelle MIT援助组织DER参数UND超参数。据/p>
Währendiemodelle trainiert werden,Führen死亡数据科学家Laufend Evaluierungen Durch。Dabei Werden Die Fehlerrate Der Modelle,Die KonfusionsMatrix und Die Anzahl Falsch Poseriver und Falsch Negativer Ergebnisse Gepruft,Oter Es Werden Bestimmte Testskripteausgeführt,z。B.Für聊天。Die Tests Sollten Mit Hilfe von TestumgeBungen,Testskripten Oder Testprogrammen如此WieWöglich自动化。据/p>
帽子的人EIN gutes潜行ermittelt,卡恩ES produktionsreif gemacht werden。DafürIST EINE Anpassung DES型号的模具Produktivumgebungnötig。在集装箱verpackt奥德在EINE SPRACHE魏某爪哇奥德C ++ umgewandelt werden(manuell奥德mittels automatischer Transformationswerkzeuge)Eventuell弄乱DER Modellcode。模具produktionsreife版DES型号搞乱MIT anderen Komponenten德Gesamtarchitektur erneut getestet werden,bevor SIEtatsächlichproduktiv ausgeliefert werden卡恩。据/p>
我是Produktiveinsatz müssen wir beobachten und verfolgen,你在实践中的模型verhält。Messgrößen wie Nutzung, Input, Output and mögliches Bias des models liefern wiichtige Informationen über dessen Leistungsfähigkeit。我们可以在Prozessstufe zurückfließen, damit weitere Verbesserungen erfolgen können:“持续智能”:zyklus wiener durchlaufen。据/p>
zwischen den verschiedenen Prozessstufen wid über pipeline gesteuert, die mittels eines CD-Orchestrierungswerkzeugs ausgeführt werden。Da jedes Artefakt versioniert wid, sind Reproduzierbarkeit和Prüffähigkeit gegeben。Dadurch lassen sich bei Bedarf Vorgängerversionen wiederherstellen。Das cd - orchestrrierungswerkzeug sorgt für den reibungslosen Ablauf des gesamten proesses und ermöglicht außerdem Governance and Compliance。我还估计Qualitätsstandards和公平检查焓。据/p>
世界投资报告möchten书房拟设在德实践anhand EINES echten,冯ThoughtWorks的realisi188bet宝金博app下载erten Kundenprojektes demonstrieren。模具发展协会unseres heutigen CD4ML-Konzepts begann VOR einigen Jahren。Damals wandten WIR北德发展协会einer Endnutzer-orientieren ML-Anwendung erstmals持续交付的。据a href="//www.pumpym.com/insights/blog/getting-smart-applying-continuous-delivery-data-science-drive-car-sales" target="_blank" class="rich-text-a-tag">模具EinzelheitenkönnenSIE票数nachlesen据/a>。据/p>
UNSERE AUFGABE BELTAND DARIN,FÜREINENFÜHRENDENEURPÄISCHENOnlib-Automarkt EINE发动机ZurSchätzungVonPreisenZu Etersheren。Der Lage Sein的Die Engine Musste,艾伦Kauf-奥德尔·奥尔库夫·弗雷斯·斯蒂滕·埃因·雷斯蒂斯彻斯·斯卡艾兹沃特祖DiePreisschätzungsollte sich auf die bshergigenfahrzeugverkäufeauf dem在线 - marktplatzstützen。Da Sich der GebrauchtwagenmarktStändigVerändert,Muss Das Prognosemodell inmer Wieder Mit Neuen Laten Trainiert Werden。Die Perfekte AufgabeFürcd4ml也。据/p>
Abbildung 4 gibt书房allgemeinen CD4ML-Ablauf献给Diesen表示konkreten秋季WIEDER。数据科学家trainieren DAS潜行MIT书房回到名单Daten DES在线Marktplatzes(小魏Angaben的Zum FAHRZEUG,Angebotspreis UNDtatsächlichemVerkaufspreis)。达斯莫代尔prognostiziert丹恩ausgehend冯Fahrzeugmodell,Fahrzeugalter,Laufleistung,Motortyp,Ausstattung usw.einen PREIS。据/p>
比伏ein模型培训可以,müssen die Daten einmal gründlich von Ausreißern, falschen listenisen order fehlerhaften Daten bereinigen werden。这是第一个质量门,这是自动检验门,我们可以看到:提供genügend verwendbare Daten,嗯überhaupt ein Prognosemodell für ein bestimatell erstellen?据/p>
这是我的培训者的电话号码:Schätzpreise liefert据em>produktionsreifes Artefakt据/em>exportiert(JAR-奥德味酸-文件)的。达斯IST DAS zweite质量门:IST死Fehlerquote DES型号akzeptabel?据/p>
Anschließendwird dieses Prognosemodell在EIN献给死去Zielplattform geeignetes格式umgewandelt,verpackt UND在EIN据em>bereitstellbares Artefakt据/em>integriert。我们可以在容器映像中创建一个完整的Webserver,在容器映像中创建一个完整的Webserver。您可以给我一个预测,我可以给您一个预测,我可以给您一个预测,我可以给您ursprüngliche,我可以给您一个预测?Verhält es sich in einer Produktivumgebung korrekt?Werden消费者驱动的合同市场?这就是质量门。据/p>
这是质量门的模型,这是新培训模型的预测和生产。我们的产品是自动的,我们的产品是自动的,我们的产品是自动的,我们的产品是自动的。据/p>
AbschließendWird Die Preispognose IM Live-Betrieb LaufendÜberwacht:Wie Reagieren DieVerkäuferinnenAuf Die Preisempfehlungen?Wie Stark Weicht der Inseratspreis vom Vorschlag ab?Wie Eng Liegen PreisPrognose undEndgültigerVerkaufspreisdes Jeweiligen Fahrzeugs Beieinander?Wie Wirikt Sich Die Umstellung Insgeamt Aus?Welchen Eindruck Haben Die Nutzer,Gibt Es Z。B. Mehr Beschwerden oder mehr阳性rückmeldungen?Füreinendirekten leistungsvergleich kann es mitunter sinnvoll sein,Das Neue Modell并行Zur Alton版本Auszuliefern。SchlussendlichFließenSämtlicheNeuenDaten在DieNächste迭代Des Modelltrainings Ein,Sei Es Direkt Durch Neue Laten Zu Verkauften Fahrzeugen Oder Indem Die HyperParameter des Modells Anhand Von BenutzerfeedbackVerändertWerden。HIERMITSCHLIEßTSICHder连续情报-Zyklus。据/p>
麻省理工学院DER机器学习eröffnenSICH Unternehmen抵达Neue ChancenEinführung冯持续交付,来自Zum intelligenten Unternehmen祖werden。第三人以德AUTOMATISIERUNG gesamten Prozesses VOM Experimentieren二楚Auslieferung UNDÜberwachungIM Produktivbetrieb wird CD4ML的Zum strategischen Wegbereiter。ES schafft EINE Technologiekompetenz,Wettbewerbsvorteile bringt模具letztlich。Ferner erlaubt ES Ihrer组织,Lernen UND在书房Prozess aufzunehmen UND所以kontinuierliche Verbesserungen祖erzielen反馈。据/p>
Bei Diesem Ansatz WerdenAußerdemdie Silos Aus Einzelnen团队undfähigkeitenaufgebrochen。Stattdessen Entsteht EineFunktionsübergreifendeKooperationsstruktur,Die ZurWertschöpfungBeiträgt。Sie HabenDieMöglichkeit,Ihre Consorisationsstruktur und Technologingschaft Neu Aufzusetzen und Ihre Teams und Symenee Auf DieGeschäftsergebnisseauszurichten。在Weiteren Artikeln underer Reihe Werden Wirde Befassen,Wie Man Diel Der Daten und Des Maschinellen Lernens Produktorientiert Betrachten Kann(Stichwort“产品思考”)。Außerdemwerdenwirdeigen,wie wichtigeeine连续智力-förderlichekulturis。据/p>
EINE weitere ausgezeichneteMöglichkeit楚erfolgreichen Anwendung冯CD4ML bietet“平台思维”埃本奥夫DER Dateninfrastruktur。大北können队抵达Neue PRODUKTE献给maschinelles Lernen UND楚Erkenntnisgewinnung施奈尔entwickeln UND freigeben,指数ohne DASS SIE冯VORN anfangen,Doppelarbeit leisten奥德gängigeKomponenten冯Grund的奥夫NEU ERSTELLENmüssen。艾因ARTIKEL wird KOMPLETT书房technischen Komponenten,工具,Techniken und明镜Automatisierungsinfrastruktur gewidmet盛,麻省理工学院德仁援助组织SICH CD4ML leichter implementierenlässt。据/p>
丹克AUTOMATISIERUNG UND offener标准liefert CD4ML死密特尔献给einen robusten Prozess楚Lenkung冯回到名单Daten UND Architektur innerhalb DES UNTERNEHMENS。麻省理工学院CD4ML拉森SICH Prozesseeinführen,麻省理工学院的田园SIE IHRE Modelle奥夫DEM WEG楚Produktionsreife在Bezug AUF公平,偏见,符合奥德ANDEREQualitätsattributeüberprüfenkönnen。魏圣美在北德SoftwareentwicklungkönnenSIE麻省理工学院CD4ML持续交付死Risiken德zügigenProduktivauslieferung冯Änderungen西歇尔UNDzuverlässigsteuern。据/p>
在allembefördert机器学习持续交付Alles的模具发展协会冯ML-Anwendungen WEG冯unberechenbarer验证的概念Programmierung轩祖professioneller,hochmoderner Softwareentwicklung。据/p>
读据/em>第1部分据/em>本系列探索企业智能模型:了解企业如何利用数据才能获得今天的见解,以及它们如何改进。据/em>
第2部分据/em>越来深入地据/em>企业情报模式,并在持续情报周期中识别摩擦点和改进机会。据/p>