Valtaistuin: Urheiluennustealusta

Valtaistuin on foorumi urheilun ennustamiseen koneoppimisen avulla. Se tarjoaa käyttäjille livekilpailuja, tietoja, ominaisuuksia, jälkitestausmoduuleja ja monia muita ominaisuuksia, jotka helpottavat kvantitatiivisten menetelmien käyttöä urheilussa. Tämä viesti esittelee valtaistuinta, sen motivaatiota ja miten pääset alkuun.

Urheilu + koneoppiminen

Ensimmäinen altistumiseni tilastotietojen ja koneoppimisen käyttämiselle urheilutiedoissa oli jatko-opiskelija. Tarvitsin sovelluksen epälineaaristen tila-avaruusmenetelmien käyttämiseen, mikä yleensä tarkoittaisi taloudellisia aikasarjoja sisältävää hanketta, mutta tunsin tekevän jotain erilaista. Joten harkitsin sen sijaan näiden tekniikoiden käyttöä signaalien poimintaan urheilutiedoissa - miten voimme erottaa joukkueiden kyvyn datasta ja sen kehityksestä ajan myötä?

Dixon-Coles (1996) on jalkapallourheilun ennustaminen

Minulle tuli nopeasti selväksi, että tämä kiinnostus oli vähemmän hämärtynyt kuin luulin ja että kentällä oli melko vakiintunut akateeminen kiinnostus ja kaupallinen kiinnostus. Samoin urheiluanalytiikassa oli vakiintunut bloginäkymä. Joten oli olemassa paljon olemassa olevaa työtä. Mutta huomasin räikeän ongelman.

Markkinoille pääsyn esteet kvantitatiivisten urheilumallien tekemisessä ovat korkeat. Erityisesti:

  • Tiedot ovat kalliita sekä välittömien että aikakustannusten suhteen (uutto ja ylläpito). Tiedot tulevat myös eri lähteistä, mikä tarkoittaa putkilinjojen rakentamista ja työläiden, mutta ratkaisevan tärkeiden ID-sovitustehtävien suorittamista.
  • Alueiden tuntemus on tärkeää, mikä tarkoittaa, että sinun on investoitava aikaa intuition hankkimiseen siitä, mitkä ovat ongelman oikeat työkalut. Asiantuntejilla on yleensä kannustin olla hiljaa pitämään yllä kaikkia mahdollisia reunojaan ennustemarkkinoilla.
  • Infrastruktuuri on kallista, esimerkiksi rakentamalla riittävä backtesting-moduuli ymmärtämään reunasi ja mallivikaantumien lähde, seuraamaan suorituskykyä julkisen vertailukohdan mukaan elävän suorituskyvyn ymmärtämiseksi ja laskemaan päivittäiset ominaisuudet, jotta voit ennustaa viimeisimmät tapahtumat.

Mutta kun otetaan huomioon vakiintunut kiinnostus ennustaa urheilua tilastollisin menetelmin, oli luonnollista kysyä, voisiko näitä pääsyn esteitä vähentää kentälle pääsyn parantamiseksi. Vastaukseni oli valtaistuin: foorumi urheilun ennustamiseen tilastojen ja koneoppimisen avulla.

Esittelyssä valtaistuin

Pisteytys perustuu käyttäjän suhteelliseen lokinmenetykseen suhteessa yleisöön, mikä määrittää hypoteettisen kassamäärän kasvun

Valtaistuimen ydin on, että se isännöi urheilua koskevia ennustekilpailuja, mukaan lukien NFL, NBA, NHL, Premier League ja muut suositut liigat. Osallistuminen on yhtä helppoa kuin todennäköisyyksien lähettäminen alustalle, joka sitten tallentaa suorituskykysi suhteessa muihin käyttäjiin.

Koneoppimiskilpailut eivät ole uusi käsite - ja tämä ei ole sinänsä innovaatio. Mutta keskittyminen urheiluun antaa Throne-kilpailuille erityisen maun, joka eroaa nykyisistä ennustealustoista:

  • Sinua arvioidaan vain live-esityksen perusteella - tarjoamme sinulle historiallista tietoa ja joitain ilmaisia ​​ominaisuuksia, mutta sinua ei arvioida pidetyn tietosarjan perusteella. Sinua arvioidaan vain tulevia tapahtumia koskevalla ennusteellasi. Tämä on ristiriidassa alustojen kanssa, jotka arvioivat uudelleen käytettävän testisarjan perusteella.
  • Pisteesi perustuu suhteelliseen log-menetykseen (risti-entropiaero) - arvioimme sinua suhteessa joukkoon julkisesti saatavilla olevia ennusteita, mikä tarkoittaa, että sinulla on suora vastustaja kilpailla ja vertailla malleja. Tämä on erityisen hyödyllistä ymmärtääksesi, kuinka mallisi saattaa epäonnistua.
  • Ominaisuuksien suunnittelu on ensiarvoisen tärkeää - monet kilpailut tarjoavat sinulle joukon tuntemattomia ominaisuuksia ja vaativat mustan kentän algoritmien koulutusta niihin. Black box -algoritmit voivat olla tehokkaita, mutta Throne painottaa hypoteesien luomista, joka tarkoittaa urheilun verkkotunnuksen mukaisten ominaisuuksien suunnittelua mallien luomiseksi, jotka löytävät reunat yleisöä vastaan.
Tallennamme esityksesi julkisia vertailuarvoja vastaan

Kilpailujen live-ennustetyyli luo myös voimakkaita kannustimia tietyntyyppisten mallien rakentamiseen, erityisesti:

  • Tuotantopalkkio - Netflix-palkintoratkaisua ei tunnetusti toteutettu, koska sitä oli liian vaikea panna tuotantoon. Koska valtaistuin arvioi suorien ennusteiden perusteella, sinun on rakennettava malleja, jotka ovat käyttökelpoisia tuotantoympäristöihin.
  • Tulkintapalkkio - mitä tapahtuu, jos mallisi alkaa suorittaa huonosti live-ennusteissa? Usein tarvitsemme malleja tulkittavissa, jotta voimme löytää ja korjata mallivaurioita. Black box -ratkaisut saattavat edelleen toimia, mutta elävässä ennusteympäristössä korostetaan entistä yksinkertaisempia, mutta tulkittavissa olevia malleja.
  • Aikavakavuuspalkkio - urheilun luonne, mukaan lukien säännöt, strategiat ja pelaajatyypit, muuttuu ajan myötä. Mallien on otettava huomioon ei-paikallaan olevat suoraan tai ne on asennettava riittävän kestäviksi kuvioiksi tasaisen reunan saamiseksi. Käyttäjien on kunnioitettava datan aikaulottuvuutta.
Kehotamme sinua luomaan omia ominaisuuksiasi, mutta Throne antaa sinulle ständin, jossa on avattavat ominaisuuskortit

Alustana Throne antaa sinulle myös työkaluja mallien rakentamiseen:

  • Tiedot: Annamme sinulle täydelliset historialliset tulokset kustakin urheilulajista, joka kattaa yleensä vähintään kymmenen vuoden tulokset jokaisessa liigassa.
  • Ominaisuudet: voit tehdä omia ominaisuuksiasi vapaasti, mutta meillä on ominaisuuksia, joiden avulla pääset alkuun. Jos teet hyviä ennusteita, palkitsemme sinut XP: llä, jonka avulla voit saada esivalmistettuja ominaisuuksiamme - edustamaan kerättäviä kortteja.
  • Vastatestaus: Annamme sinulle ilmaisen backtesterin, jotta voit arvioida mallisi suorituskykyä yleisön suhteen ja saada käsityksen siitä, missä mallisi saattaa menestyä tai epäonnistua.
Taustatestausmoduulin avulla voit arvioida mallisi ennen reaaliaikaisten ennusteiden tekemistä

Kaikilla näillä ominaisuuksilla on rekisteröidyille käyttäjille ilmainen pääsy.

Tietysti, jos et halua osallistua kilpailuihin, mutta haluat vain pelata ilmaisilla urheilutiedoilla, se on myös hienoa! Ole hyvä ja lyö itsesi!

Päästä alkuun

Rekisteröinti on helppoa: linkki vain verkkosivustolle nykyisellä GitHub-tililläsi ja olet valmis lataamaan tietoja, tekemään malleja ja lähettämään ennusteita. Meillä on hyvä valikoima urheilulajeja ja kilpailuja, joista voit valita, ja aiomme laajentaa kilpailujen määrää tulevina kuukausina yhteisön kiinnostuksen mukaan.

Meillä on täällä Aloitusopas siitä, kuinka käytettävissä olevia tietoja voidaan käyttää ennusteiden tekemiseen ja lähettämiseen. Tähän johdantoviestiin liittyviä lisäkysymyksiä laatin täällä usein kysytyt kysymykset.

Meillä on myös Slack-kanava, jossa voit keskustella alustasta ja urheilun ennusteista yleisemmin yhteisömme kanssa ja saada vinkkejä muilta käyttäjiltä mallien rakentamisen aloittamisesta.

Henkilökohtaisesti tämä on ollut projekti, joka on rakennettu kokonaan vapaa-aikaan viimeisen 12 kuukauden aikana. Olen todella innoissani siitä, kuinka ihmiset käyttävät alustaa, ja olen myös innoissani mahdollisuuksista, joita urheiluennusteisiin ja analytiikkaan keskittyvä kukoistava yhteisö voi luoda.

Mennään!

Ross